
Photo by
voice_watanabe
北関東のしゃべりと音声合成の親和性
北関東の言葉。
言語的にはなかなか音声合成と相性が良いんです。
「使われる単語と言い回し」と「イントネーション」の組み合わせ的に。
ちょっとおさらい
文字を入力すれば言葉として出力される音声合成。入れればなんでもしゃべるか、と言えば、結構苦手なものがある、というのはこれまでも書いてきました。
逆に、得意なことももちろんあります。
なんで方言は苦手?
またまたおさらいになりますが、
・方言の学術的ルールが確立されてない
につきます。誰かが頑張って作れば、それに従って読めば良いだけ。
でも、なんで作らないかと言えば、需要の問題です。
特定の地方の言葉の音声合成をお金と時間をかけて作る経済性。
では、標準語と言われる言葉と何が違うのでしょうか。
音声合成の仕組みのおさらい
以前、仕組みについては解説をしています。
簡単に書けば
テキスト→日本語形態素解析(標準語)→イントネーション当てはめ→合成
となります。ここで出てきました、イントネーション。
じゃあ、そこをカットすると?
日本語のイントネーションは複雑そうです。でも、コンピュータの処理に落とし込むと、なんと大きくは2つ。
・上がるか
・上がらないか
これだけ。なので、制御は一つだけ。上がる記号を入れるか入れないか。
これを外してみたらどうなるのでしょうか。きっとフラットな感じになる予定。
北関東の方言になりました・・・
実際にやってみました。
◾️音声合成のアクセント制御をカットすると、ある地方の話し方に似てしまいます。 pic.twitter.com/abSKta01ee
— 音声合成による音声合成のための音声合成のお話 (@gouseichan) February 2, 2021
つまり、北関東の方言は
「文字は標準語」
「イントネーションがフラット」
ということになります。もちろん、超ざっくり言えば。
「上がる」場所を決めるルールが、色々な方言で研究されて整理され、さらに言葉の置き換えも自動でできれば、方言合成機ができるはず。
AIとかディープラーニングとかで実現しないかなー。(ひとまかせ)
いいなと思ったら応援しよう!
