昨日「ChaSen」を使ってあれこれしていたんですが、ローマ字にするすべが難しく、別の方法がないのかなぁ..。と、web上を探してみました。。
すると、「
kakasi」っていうのが出てきました。。
「
kakasi」は、漢字かなまじり文をひらがな文やローマ字文に変換することを目的として 作成したプログラムだそうです。
早速インストールしてみることに。。
terminalから
CODE:
%wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz
% tar xzvf kakasi-2.3.4.tar.gz
% cd kakasi-2.3.4
% ./configure --host=powerpc-apple-bsd
% sudo make
Password:
% sudo make install
/usr/local/bin/kakasi にインストールされますので、これも使いやすいようにシンボリックリンクを張ってしまいます。
CODE:
% sudo ln -s /usr/local/bin/kakasi /usr/bin/kakasi
まずは、 -help で使い方の確認
CODE:
% kakasi -help
KAKASI - Kanji Kana Simple Inverter Version 2.3.4
Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.
Usage: kakasi -a[jE] -j[aE] -g[ajE] -k[ajKH] -E[aj] -K[ajkH] -H[ajkK] -J[ajkKH]
-i{oldjis,newjis,dec,euc,sjis} -o{oldjis,newjis,dec,euc,sjis}
-r{hepburn,kunrei} -p -s -f -c"chars" [jisyo1, jisyo2,,,]
Character Sets:
a: ascii j: jisroman g: graphic k: kana (j,k defined in jisx0201)
E: kigou K: katakana H: hiragana J: kanji(E,K,H,J defined in jisx0208)
Options:
-i: input coding system -o: output coding system
-r: romaji conversion system
-p: list all readings (with -J option)
-s: insert separate characters (with -J option)
-f: furigana mode (with -J option)
-c: skip chars within jukugo (with -J option: default TAB CR LF BLANK)
-C: romaji Capitalize (with -Ja or -Jj option)
-U: romaji Upcase (with -Ja or -Jj option)
-u: call fflush() after 1 character output
-w: wakatigaki mode
Report bugs to <bug-kakasi@namazu.org>.
早速使ってみましょう。
test.textの中身は
CODE:
日本語を変換してみよう。
になっています。
CODE:
% kakasi -Ha -Ka -Ja -Ea -ka < test.text
nihongowohenkanshitemiyou.
とすれば、ローマ字になるみたいです。
しかしこれではアルファベットの羅列になってしまいますので、分ち書きのオプションも付けてみます。
CODE:
% kakasi -w -Ha -Ka -Ja -Ea -ka < test.text
日本語 wo 変換 shitemiyou .
あれ?漢字が変換されなくなったぞぉ?
パイプを使って2回通してみることに。。
CODE:
% kakasi -w <test.text | kakasi -Ha -Ka -Ja -Ea -ka
nihongo wo henkan shitemiyou .
いけましたね。。w
では、Macにしゃべらせてみます。
パイプを使って、sayに渡すだけです。。
CODE:
% kakasi -w <test.text | kakasi -Ha -Ka -Ja -Ea -ka |say
しゃべったぁ!(爆
これをファイルに残すには、sayに、出力先のオプションを付けてやるだけです。
CODE:
kakasi -w <test.text | kakasi -Ha -Ka -Ja -Ea -ka |say -o ~/desktop/speektext.aiff
これで、デスクトップに"speektext.aiff"っていうファイルができました。
なんで、aiffファイルにするかっていうと、自分のMacがしゃべるだけで、他の人に聴こえないからです。w
これをphpからsystem関数を使って利用すれば、web上でも変換できるはず。。
最終的には、lameか何かでmp3にすると良さそうですね。