見出し画像

AI音声変換「セイレンボイス」について語りたい―140文字では収まらない“未来を簡単に体験する”価値の話―

結論:
「最新音声技術を現実的な価格で使いたい」

 どんな声の人でも、理想の声になりたいと思いますが、それが叶います。しかも、おそらくかなり嬉しい価格帯のサブスクリプションモデルになるでしょう。「声を使うあらゆる分野が、最新技術で一新される」レベルの機能が、気軽に使えるところまできたので、試してみませんか? という話です。

 「へー、じゃあ話聞いてみるわ」っていう人は先へお読みください。

1:これを文章にした理由

 先日、ツイッターでgoogleフォーム形式のアンケートを取らせていただいたのですが、自分の訴求力が足りないことと、「そもそもツイッターで全文読んでリンクまで行ってくれるのは見た人の3%」というデータを得たので、文字数の制限無しで、なぜこの技術を使いたいかの魅力を書きます。そのうえで、現時点ではこういう目算ですよ、だから興味があったら挙手してね、という感じです。

 その上で、今回の記事については既存の技術に対しての不満や、自分にとってマイナスの要素であり、共感してもらえるであろう「これはどうにかならないのか」というところから始まり、論拠こみで「改善できると良いな」という形でアプローチします。

2:テキストトゥスピーチ(ゆっくりボイス)に対して

 いわゆる「ゆっくりボイス」を使った動画に対して、不満がありました。説明している内容や情報に価値があっても、ゆっくりボイスで喋られていると内容が頭に入らないですし、特徴がないと感じます。

 「個人的な問題なのかな」という疑問もあったので、少し調べてみると学術論文に「ゆっくりボイスを聞くと不快な感情の際に発する脳波が検出される事例が多い」という発表があったことと、普通に検索しても「あれどうにかならんのか」という声がいっぱい観測できたので、自分の中でこれを使う選択肢が消えました。「自分は気にならない」という方は、「より良い方法がありますよ」という話をするので、ちょっと先まで読んでください。

3:自分や周りの意見を聞いた感触として「声って難しい」

 自分は司会やMC、ラジオなどの出演経験がありますが、声が病気によって元来の声を失った現在は、自分の声にコンプレックスがあり、喋る必要のあるシーンでしか声を出さないですし、自分の声で動画を出したいと思わないことから、「自分の声や変換で出る声で表現しない」という選択肢は理解できます。

 その上で、嫌いな自分の声ではなく、「聞く人も聴いていて魅力的に思える声で情報発信がしたい」と思っていました。周囲に相談したところ、「自分で自分の声を好ましくない」「そもそもボイスチェンジャーだと元の声が良くないとダメでは」といった「いい声になりたい需要」があったのです。

4:声を届ける手段として見つけた「光」

 何かを伝える動画を作るなら、きちんと話したい。でも、自分の声にはコンプレックスがあるという問題にぶつかった時に、「声に自信がないなら、代替手段を使おう」というアプローチの中で、この「セイレンボイス」に行き当たりました。

  現時点でサンプルボイスが100個あり、どれもがAIで作られた声なのですが、以下の点で優れていました。

  • ボイスチェンジャーでありがちな「ケロった声(ケロリ)」がない

  • 読み上げ系ソフトの特徴的な「人工的読み上げ」の音ではない

  • 自分のイントネーションでソフトを通すと、そのまま別人の声になる

 この3つが自分にとって革命的でした。

 なにより凄かったのは、人間ではクリアできなかった問題である「声を自然に低くして、いい声で喋れる」の実現です。

 人間の声の性質として、本来持っている声質より高い音は出せても、低い音は才能として持っていない限り、物理的に低くして自然さを保つのは不可能でした。ピッチやフォルマントの調整では不自然さがでてしまい、いわゆる「ボイスチェンジャーの低音」というところでしか妥協できなかったのです。

 しかし「セイレンボイス」は、特定の声質という形の出力ですが、自分の普段の喋り方で、イケボになれます。 

 現時点(2021/12/11)でこの技術を無料で体験できるので、とりあえず興味が出た方はhttps://seiren-voice.dmv.nico/でテストしてみてください。
※推奨ブラウザはパソコン版Chrome・Safari、iOS版Safari、Android版Chromeです。ただしスマホなどでは機種ごとで正しく録音できないという声をいただいていますので、ご了承ください。

5:最新技術なのに現実的な価格帯を推測できた

 他の技術もあるだろうと調べてみたのですが、個人使用でも「月額5万からのサブスク」という予算感での機能になり、ランニングコストとして個人がスタートアップに使うには辛いので、選択肢に入れられませんでした。 
 
 現時点でマネタイズされていないため、セイレンボイスの価格帯は未知数ですが、声優さんにお仕事をお願いしているゲーム会社の社長に技術と需要、価格帯の推察をヒアリングしてみたところ、以下の解答をもらいました。

①現時点で声優さんはとにかく数が膨大にいるので、演技力まで考慮するなら声優さんのほうが安価で済む可能性がある。

②声優さんの演技と声質を見込むので、1度お願いしたものに関してはスケジュールでスタジオや機材を確保することなどを考えると、個人や規模の小さい法人ではなかなか踏み切れないことも解る。

③声優さんのお仕事と、この技術自体は違うシーンでの活用が見込めるため、競合しない。技術的な予想としては、継続して研究開発することも見込んで、月額100万円を超えればおそらく採算可能になる。

④金額は月100万を最低ラインとしても1万円が100人か、5000円が200人、2500円が400人いれば回収できるので、現実的に交渉できると考える。そのためには色んな人に試してもらって、アンケートを取ったほうが良い。

というお答えを頂いたので、「じゃあ自分でも払って使いたいかも」と思い、アンケートを取ってみました。
 試された方の反応はとても好評ですが、記事公開時でアンケート集計が一桁と、自分の伝え方が悪いことなども思い知ったので、色んな人に試してもらったうえで、感想や希望を聴かせていただきたい、という状況になります。

6:最後に

 ここまで読んでいただいて、ありがとうございました。
 長くなりましたが、「試して損のない技術だから広まれー!」という思いでノートにアップさせていただきました。
 以下の投稿フォームから、同じような前書きと公開されているセイレンボイスの体験リンクとアンケートフォームを用意しましたので、解答をいただき、皆さんの要望を聴かせてください。
 
何卒よろしくお願いいたします。
https://forms.gle/Pz6Jx2JA681MSvY29 


いいなと思ったら応援しよう!