芸名・曲名・バンド名…音声合成殺しかっ!?
音声合成、ちょっと困るあるあるの結構上位に来る問題について、実際の実験もしてみました。
困るのは、「辞書にない言葉」。なので、実際芸名・曲名・バンド名などは造語が氾濫して大変なことになってます。音声合成的に。
芸名はそれこそ造語大会!
つまり、「固有名詞、しかも面白い方の」問題です。
日本語のデータベースに、色々な単語があります。でも、新人の漫才師コンビが誕生するたびに更新するのは不可能。
もし、入ってなければ、どうやってるのでしょう。
・辞書にあるもので強引に読む
・文字数で一般的なイントネーションで読む
などで合成は頑張ります。
今回読んでみた、「つわもの」たち
「つのだ⭐︎ひろ」
「BOØWY」
「KING GNU」
「新田真剣佑」
「Official髭男dism」
うん、人間でも迷いますね。
お笑いも大変ですが、ミュージシャン界隈の方が、やりたい放題度が高いので、敢えてそちらにチャレンジしてみました。
さて、どうなるでしょう。
予想通りボロボロ
そんな感じになりますね。でも、ミュージシャンを取り上げたのには理由があります。
音声合成の主戦場、カーナビは、新しい通りの名前や、ランドマークの名前が日々産まれます。
そのたびに録音し直しは不経済なので、かなり前から音声合成。
でも、新規の言葉の登録は人間。
カーナビのもう一つの用途はカーオーディオ。
好きな曲を好きなように聴くのも良いのですが、オーディオデータに付属するタグ情報で、アルバム名、歌手名、曲名などがあり、これを読み上げるオプションもあります。
この時に、ミュージシャン名。これは、日々、登録しなければならないところ。
読まない=登録できてない
この合成エンジンも、ある頻度でアップデートされる辞書を使っています。
ということは、更新はOfficial髭男dism以前、ということが分かります。
AIで解決!?
この問題はずーっとつきまといます。
でも、手法は変えられるかもしれません。
世の中で話されている言葉を集め、AIによる分析を行う、などして自動収集というのができれば、常に新しい単語が辞書に反映できます。
そのようなアプローチも実際行われていますので、ますます音声合成は今風の言葉にもついていくようになる!たぶん。