
Photo by
stwchairtennis
今の技術で工夫する人vs理想じゃない!と使わない人 音声合成
世の中100点満点のサービスや製品はありません。
それを待ってたら一生使えないぞ、という技術の話です。
音声合成もそうです。
CPUの発達、技術の向上、新技術の導入、など、時代とともに品質も上がってきました。
ずいぶん「人間に近づいた」と言えますが、「近づいた=まだ到達してない」という事でもあります。
ここが本日のポイント。
やはり人間には追い付かない
受験勉強で考えます。
50点しか取れない科目を勉強すると、65点→80点→87点→…みたいに点数は向上します。
でも、いくら頑張っても100点にはなりません。
技術も同じです。
なぜなら100点に近づくと、別の要素が「違い」として明らかになるのです。65点の時は気にしてなかったのに…
色々な実例(おさらい)
現在、音声合成は95点は取れていると思います。
そうなると、以前は気にならなかった点が気になってきます。
今も指摘できるポイントとしては、
・間が一定
・音量の大小がない
・感情が表現されない
・イントネーションが不自然な箇所が必ず出る
・滑らかじゃない部分がある
など。
多分、発明されて最初にしゃべった時よりむちゃくちゃよくなってるはずなんですが、研究というのは厳しいもので、常にどこかが気になる。
しかも、声というのは研究者じゃ無くても多くの人が毎日触れてるから、これらの違和感はすぐ分かってしまいます。
割り切りも大切
では、使えないのか?というとそんなこともなく。
これまでに挙げた「足りないところ」を理由に持ち出す人は、たぶん100年後も使いません。営業する時間も無駄なので、さっさと切り上げましょう。
「音声があれば便利なところ」
「音声を録音で使ってたけど合成の方が便利」
というところで使えば良いのです。
じゃあ、それはどこ?というのはまた別の日に。
やっぱり人間に対抗するのは、早口言葉と広辞苑を一気に読むときくらいにします。 https://t.co/7eipYJr12m
— 音声合成による音声合成のための音声合成のお話 (@gouseichan) January 23, 2021
人間より便利なところがあるんだから、勝負しないでも良いよ!
いいなと思ったら応援しよう!
