juliusを試す - cotricover

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition EngineをみるとLinuxとWindowsには対応しているそうだ。

Macでも使える。

まず、GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition EngineからLinux版 Juliusディクテーション実行キットをダウンロードする。展開してbinに入っているバイナリは実行できなかった。srcディレクトリにソースらしきものがあるけど、せっかくなので最新のソースをダウンロードする。

ぼくがダウンロードしたのはjulius-4.0.2。

解凍して、

% ./configure
% make

これでjuliusディレクトリにバイナリができている。

ディクテーション実行キットのディレクトリに戻る。

% cd ../dictation-kit-v3.2

fast.jconfをエディタで開いてみて

-input mic

となっていることを確認する。

あとはさっきコンパイルしたjuliusを使うようにして、あと-charconvオプションも指定してあげる。Macではこれをしないと出力が文字化けする。

% ../julius-4.0.2/julius/julius -C fast.jconf -charconv EUC-JP UTF-8

ざっと実行ログが出力されたあと、please speakと言われるのでMac内蔵のマイクに話しかける。
簡単は言葉はちゃんと認識できるようだ。

<<< please speak >>>Warning: strip: sample 0-93 is invalid, stripped
pass1_best:  こんにちは 。           
sentence1:  こんにちは 。 
pass1_best:  オハイオ                
sentence1:  オハイオ 。 
pass1_best:  こんばんは 。            
sentence1:  こんばんは 。 
pass1_best:  は 追加 。               
sentence1:  おなか すい た

よくわかっていなかったがその後ためしてみると結構すごい。文章をばっちり認識している。これがN-gram 言語モデルの効果ってことか。

pass1_best:  買い物 に 行っ て 大根 を 買う 。                         
sentence1:  買い物 に 行っ て 、 大根 を 買う 。 
pass1_best:  東京 都 今日 、 許可 局                                   
sentence1:  東京 と 、 今日 、 許可 局 。 
pass1_best:  大阪 から 東京 まで は 新幹線 で 疑似 た ん です 。           
sentence1:  大阪 から 東京 まで は 新幹線 で 二 時間 半 です 。 
pass1_best:  千歳空港 を                                                   
sentence1:  千歳空港 。 
pass1_best:  関西国際空港                                                  
sentence1:  関西 国際空港 。 
pass1_best:  関西国際空港 から ソーテック 項 まで に                       
sentence1:  関西国際空港 から 、 政府 港 まで 行く 。 
pass1_best:  関西国際空港 から 千歳空港 まで ご                            
sentence1:  関西国際空港 から 、 千歳空港 まで 行く