juliusの辞書に言葉を追加

「juliusの辞書に言葉を追加」と調べると、yomi2voca.pl
を使用して。。。これは、perlだからwindowsに環境構築を。。。
みたいな記事がいっぱい出てくる。確かに昔はそうだったのであろう。

だが、2022年12月もうそんなめんどくさい方法は取らなくていいのだ!!(自分が開発したわけでもないのに)





自分は下のダウンロードサイトからjuliusの話し言葉モデルキット (ssr-kit)をダウンロードした。

osdn.net




自分の環境


windows 11


・julius 話し言葉モデルキット (ssr-kit) ver4.5



辞書に追加方法

まず、ダウンロードしたzipファイルを展開し、そこに移動する。

次に、適当なテキストファイル(ここではtest.txtとする)を作成して、下のようにshift-jisで
「認識させたい言葉 ひらがなの読み方」を書いていく。
言葉と読み方の間は、tabで空ける。
最後に空改行を入れない。


節約術    せつやくじゅつ
ありよりのあり    ありよりのあり
スタレン    すたれん
リア垢    りああか
告つぶ    のりつぶ
鬼電    おにいなずま
百里ある    ひゃくりある




dictool.exeの実行

作成し終わったら、次に同じディレクトリ内の「dictool.exe」を実行する。
「新しい辞書を指定する」を押す。


適当に名前を入れる。(ここではtest.htkdicとする)
次に、「テキストファイルから読み込む」を押す。


先程作成したテキストファイル(test.txt)を読み込ませる。
*ここで、文字化けしていたらtest.txtがshift-jisではないので、shift-jisに直す。
次に「辞書に書き出す」を押す。


はい。完成!!!

main.jconfの編集

後は、この辞書ファイルを使うように設定していきます。
同じディレクトリ内のmain.jconfを編集することで変えることが出来ます。
main.jconfをエディタで開きます。
下の写真でマーカーが引かれている「-v 」の後が辞書ファイルになります。


なので、ここをdictool.exeで作成したtest.htkdicに変更し、保存します。

実行


run.batを実行することで実際に自身で変更した辞書ファイルを使って認識させることが出来ます。

追記
もとから使われている辞書に追加したい方は、test.htkdicの中身をデフォルトの辞書であるmodels/csj.pdp.htkdicにコピペすることで、
追加することが出来ます。その際は、main.jconfを-v models/csj.pdp.htkdicに戻すことをお忘れなく!!


いいなと思ったら応援しよう!