![見出し画像](https://assets.st-note.com/production/uploads/images/44017069/rectangle_large_type_2_a413c136c8c929918e8076070edc302e.png?width=1200)
音声合成 どうぶつの森のモノマネ
必ずしも「流暢な音声」は必要ではない
音声合成は、キャラクターがしゃべる、という使われ方をすることが多いのですが、そこで人間のようにすらすらと滑らかにしゃべることが必須、じゃない場合もあります。
どうぶつの森の場合、ちょっとクセのあるキャラたちが、なんか一生懸命しゃべってます。音を聞いても何を言ってるか分かりません。でも、一生懸命な感じが伝わって愛くるしい。
つまり、表現したいことが分かっていれば、しゃべらせるやり方は「高品質」である必要はないのです。
どう森、どうやってるの?
あのしゃべり、いったいどうなってんのか、推測でやってみました。
よく聞いても、文字はとらえられない。では、意味のある文字ではないのでは?と考えて、適当に文字を並べてみたところ…
実際の音をお聴きください。
あsdjk多ポイウエブい終えポイ乳母jだs;lkじゃえおぴあjおいぐあじゃd;lkじゃ dg杯dぼパいう亜dbじゃjk;あjk;だklgじゃてあjk
◾️モノマネ
— 音声合成による音声合成のための音声合成のお話 (@gouseichan) January 9, 2021
あsdjk多ポイウエブい終えポイ乳母jだs;lkじゃえおぴあjおいぐあじゃd;lkじゃ dg杯dぼパいう亜dbじゃjk;あjk;だklgじゃてあjk pic.twitter.com/sTQdgCEKZG
合ってるか、は分かりません。
文字表示とシンクロしてるので、まずは正確な文字を並べて、その文字列をランダムに変換して再合成、といった処理を行ってるのかもしれません。結構なセリフ量なので、それを自動化してるかも。
今ある品質でも使い方で
どう頑張っても100点にならない音声合成技術。
このように、「コンテンツに合った使い方」をすれば、いつだって楽しく使える訳です。
しかし、うまい具合に可愛さを出してますなー。感心しますなー。くそー。悔しいぞ。
いいなと思ったら応援しよう!
![にしけん](https://assets.st-note.com/production/uploads/images/43332283/profile_e0ead92eebce67298ad1e5659e357f09.png?width=600&crop=1:1,smart)