音声合成　どうぶつの森のモノマネ

にしけん

2021年2月3日 09:59

必ずしも「流暢な音声」は必要ではない

音声合成は、キャラクターがしゃべる、という使われ方をすることが多いのですが、そこで人間のようにすらすらと滑らかにしゃべることが必須、じゃない場合もあります。

どうぶつの森の場合、ちょっとクセのあるキャラたちが、なんか一生懸命しゃべってます。音を聞いても何を言ってるか分かりません。でも、一生懸命な感じが伝わって愛くるしい。

つまり、表現したいことが分かっていれば、しゃべらせるやり方は「高品質」である必要はないのです。

どう森、どうやってるの？

あのしゃべり、いったいどうなってんのか、推測でやってみました。

よく聞いても、文字はとらえられない。では、意味のある文字ではないのでは？と考えて、適当に文字を並べてみたところ…

実際の音をお聴きください。

あsdjk多ポイウエブい終えポイ乳母jだs;lkじゃえおぴあjおいぐあじゃd;lkじゃ dg杯dぼパいう亜dbじゃjk;あｊｋ；だｋｌｇじゃてあｊｋ

◾️モノマネ

あsdjk多ポイウエブい終えポイ乳母jだs;lkじゃえおぴあjおいぐあじゃd;lkじゃ dg杯dぼパいう亜dbじゃjk;あｊｋ；だｋｌｇじゃてあｊｋ pic.twitter.com/sTQdgCEKZG
— 音声合成による音声合成のための音声合成のお話 (@gouseichan) January 9, 2021

合ってるか、は分かりません。

文字表示とシンクロしてるので、まずは正確な文字を並べて、その文字列をランダムに変換して再合成、といった処理を行ってるのかもしれません。結構なセリフ量なので、それを自動化してるかも。

今ある品質でも使い方で

どう頑張っても100点にならない音声合成技術。

このように、「コンテンツに合った使い方」をすれば、いつだって楽しく使える訳です。

しかし、うまい具合に可愛さを出してますなー。感心しますなー。くそー。悔しいぞ。

いいなと思ったら応援しよう！

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います！そしたら、もっと面白い記事を書く時間が増えます！全額自分のため！