juliusを試す
GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition EngineをみるとLinuxとWindowsには対応しているそうだ。
Macでも使える。
まず、GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition EngineからLinux版 Juliusディクテーション実行キットをダウンロードする。展開してbinに入っているバイナリは実行できなかった。srcディレクトリにソースらしきものがあるけど、せっかくなので最新のソースをダウンロードする。
ぼくがダウンロードしたのはjulius-4.0.2。
解凍して、
% ./configure % make
これでjuliusディレクトリにバイナリができている。
ディクテーション実行キットのディレクトリに戻る。
% cd ../dictation-kit-v3.2
fast.jconfをエディタで開いてみて
-input mic
となっていることを確認する。
あとはさっきコンパイルしたjuliusを使うようにして、あと-charconvオプションも指定してあげる。Macではこれをしないと出力が文字化けする。
% ../julius-4.0.2/julius/julius -C fast.jconf -charconv EUC-JP UTF-8
ざっと実行ログが出力されたあと、please speakと言われるのでMac内蔵のマイクに話しかける。
簡単は言葉はちゃんと認識できるようだ。
<<< please speak >>>Warning: strip: sample 0-93 is invalid, stripped pass1_best: こんにちは 。 sentence1: こんにちは 。 pass1_best: オハイオ sentence1: オハイオ 。 pass1_best: こんばんは 。 sentence1: こんばんは 。 pass1_best: は 追加 。 sentence1: おなか すい た
よくわかっていなかったがその後ためしてみると結構すごい。文章をばっちり認識している。これがN-gram言語モデルの効果ってことか。
pass1_best: 買い物 に 行っ て 大根 を 買う 。 sentence1: 買い物 に 行っ て 、 大根 を 買う 。 pass1_best: 東京 都 今日 、 許可 局 sentence1: 東京 と 、 今日 、 許可 局 。 pass1_best: 大阪 から 東京 まで は 新幹線 で 疑似 た ん です 。 sentence1: 大阪 から 東京 まで は 新幹線 で 二 時間 半 です 。 pass1_best: 千歳空港 を sentence1: 千歳空港 。 pass1_best: 関西国際空港 sentence1: 関西 国際空港 。 pass1_best: 関西国際空港 から ソーテック 項 まで に sentence1: 関西国際空港 から 、 政府 港 まで 行く 。 pass1_best: 関西国際空港 から 千歳空港 まで ご sentence1: 関西国際空港 から 、 千歳空港 まで 行く