2011年12月5日月曜日

漢字→かな(ローマ字)変換プログラム KAKASIのインストールと使い方

漢字→かな(ローマ字)変換プログラム KAKASI
漢字とかひらがなとかに変換するツール。

① kakasiのインストール、
$ wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz
$ tar zxvf kakasi-2.3.4.tar.gz
$ cd kakasi-2.3.4
$ ./configure
$ make
$ sudo make install
普通どおり。

2、コマンドラインからの利用
[karino@115x125x111x181 ~]$cat test
漢字混じりの文章
[karino@115x125x111x181 ~]$cat test | nkf -e | kakasi -JH | nkf -w
かんじまじりのぶんしょう
[karino@115x125x111x181 ~]$cat test | nkf -e | kakasi -JH | kakasi -Hk |nkf -w
カンジマジリノブンショウ
[karino@115x125x111x181 ~]$cat test | nkf -e | kakasi -JH | kakasi -Ha |nkf -w
kanjimajirinobunshou

変換前と変換後を指定する。

J : 漢字
H : ひらがな
a : ローマ字
K : カタカナ

※ kakasiはeuc-jiで動作するようなので、
使用する前後で文字コードを入れ替えている。


3、辞書の追加
kakasi に辞書を追加する。
こんなかんじ。


追記
カタカナ、小文字「k」じゃなくて大文字「K」
にしないと効かなかった。

-JH : 漢字→ひらがな
-KH : カタカナ→ひらがな
-Ha : ひらがな→アルファベット

0 件のコメント:

コメントを投稿