このへんで話題になっていたので。。
ちょっと遊んでみました。
Macには標準で text to speech っていうのが付いているんですが、この「
iSpeech」を使うと、日本語で書かれたファイルをちゃんと読んでくれるんです。。
で、その日本語解析の部分に、「
ChaSen」が使われているらしく、気になって一日遊んでました。
iSpeechをインストールするとChaSenも一緒にインストールされるのですが、どこに入っているのかというと、terminalでこうやれば判ります。
terminal:
CODE:
% locate chasen
/usr/local/bin/chasen
/usr/local/bin/chasen-config
/usr/local/etc/chasenrc
..
..
..
..
一番上の、/usr/local/bin/chasen がChaSen本体です。このままパス指定すれば使えるんですが、めんどくさいので、シンボリックリンクを通しちゃいます。
CODE:
sudo ln -s /usr/local/bin/chasen /usr/bin/chasen
Password:
これで、
CODE:
% chasen
とすれば、使えます。
(パーミッションを変えれば、webから使えるようにもできますよ..。たぶん..。)
とりあえず、読みやすそうなところに日本語のテキストファイルを置きましょう..。w
テキストの内容は、
test.text
CODE:
これは日本語のテスト
にしました。
で、
CODE:
% chasen test.text
としたら、こんなのが出てきました。。
CODE:
これ コレ これ 名詞-代名詞-一般
は ハ は 助詞-係助詞
日本語 ニホンゴ 日本語 名詞-一般
の ノ の 助詞-連体化
テスト テスト テスト 名詞-サ変接続
EOS
なんじゃコリャ??
やっぱりマニュアルを読んだほうが良さそうです。。(爆
マニュアルとヘルプを読みながら、見つけたオプションがこれ。。
CODE:
% chasen -F"%y" test.text
コレハニホンゴノテスト
全部カタカナになって出てきます。
全部アルファベットで出てくれば、そのまま text to speech に渡せばしゃべってくれそうですが、そんなオプションは無いみたい。。外部辞書でつくればいいのかな?
ちなみに、tarminal で text to speech にしゃべらせるには、
CODE:
say -v Zarvox "hello"
とすればイイみたいです。。
続きはまた明日。。