北関東のしゃべりと音声合成の親和性

2021年3月16日 10:20

北関東の言葉。

言語的にはなかなか音声合成と相性が良いんです。

「使われる単語と言い回し」と「イントネーション」の組み合わせ的に。

ちょっとおさらい

文字を入力すれば言葉として出力される音声合成。入れればなんでもしゃべるか、と言えば、結構苦手なものがある、というのはこれまでも書いてきました。

逆に、得意なことももちろんあります。

またまたおさらいになりますが、

・方言の学術的ルールが確立されてない

につきます。誰かが頑張って作れば、それに従って読めば良いだけ。

でも、なんで作らないかと言えば、需要の問題です。

特定の地方の言葉の音声合成をお金と時間をかけて作る経済性。

では、標準語と言われる言葉と何が違うのでしょうか。

以前、仕組みについては解説をしています。

簡単に書けば

テキスト→日本語形態素解析（標準語）→イントネーション当てはめ→合成

となります。ここで出てきました、イントネーション。

日本語のイントネーションは複雑そうです。でも、コンピュータの処理に落とし込むと、なんと大きくは２つ。

・上がるか
・上がらないか

これだけ。なので、制御は一つだけ。上がる記号を入れるか入れないか。

これを外してみたらどうなるのでしょうか。きっとフラットな感じになる予定。

実際にやってみました。

◾️音声合成のアクセント制御をカットすると、ある地方の話し方に似てしまいます。 pic.twitter.com/abSKta01ee
— 音声合成による音声合成のための音声合成のお話 (@gouseichan) February 2, 2021

つまり、北関東の方言は

「文字は標準語」
「イントネーションがフラット」

ということになります。もちろん、超ざっくり言えば。

「上がる」場所を決めるルールが、色々な方言で研究されて整理され、さらに言葉の置き換えも自動でできれば、方言合成機ができるはず。

AIとかディープラーニングとかで実現しないかなー。（ひとまかせ）

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います！そしたら、もっと面白い記事を書く時間が増えます！全額自分のため！