【やってみた】自分のAI音声を作ってみた
こんにちは、「Experience×Technology(体験×技術)」の松田です。
今回は『AI音声』のお話です。
AI音声とは、「人工知能(AI)技術によって、コンピューターが人間のような自然な声で話せる技術」のことです。
例えば、私たちがiPhoneの『Siri』に向かって「今日の天気は?」と聞くと、『Siri』が声で答えてくれますね。これがAI音声です。
この記事では、自分のAI音声を作って遊ぶ方法を紹介します。
OnSay.ai(β版)
『OnSay.ai(β版)』は、PCやスマホのマイクに話しかけるだけで、『自分の声をもとにしたAI音声』が作れるサービスです。
また、作ったAI音声に歌を歌わせたり、ボイスパーカッションをさせることができます。
2024年8月現在、GoogleアカウントまたはDiscordアカウントでログインすれば、無料で利用できます。
実際にAI音声を作ってみた
AI音声は、本物の人間の発話パターンをコンピューターに学習させることで作られます。
そのため、まずは自分の声で大量の文章を読み上げる必要があります。
『OnSay.ai(β版)』には、台本として100個の文章があらかじめ用意されています。
100個も読むのは大変そう……というか、10分間近く喋り続けることになるため、実際大変でした!
しかし、台本の中に難しい文章とかんたんな文章が程よいバランスで混ざっていたり、文章自体にユーモアがあったりと、ユーザーを飽きさせない工夫がされているため、最後まで楽しく読むことができました。
すべての録音を終えると、AI音声の素となる『AI音声モデル』の生成が始まります。
生成は順番待ちとなり、サーバー側での処理が完了するまで待つ必要があります。今回は8時間ほどかかりました。
翌日サイトにアクセスすると、AI音声モデルの生成が完了していました。
いよいよ、AI音声に歌を歌ってもらいます!
『OnSay.ai(β版)』では、あらかじめ用意された曲の中から、AI音声に歌わせる曲を選ぶ仕組みになっていました。
いくつか聴き比べてみましたが、一番「自分の声っぽい」と感じたのは『ドラム&ベース』でした。
録音の品質や本人の声質によって、合う曲・合わない曲がありそうですね。
日々進化し続けるAI技術。
AI音声を使った新しいサービスやコンテンツの登場が楽しみですね。
X(旧Twitter)
このnoteとも連携して発信していくので、興味のある方はフォローよろしくお願いいたします!
Experience×Technology(体験×技術)
面白い海外事例の紹介、今までの実績を振り返りながらの裏話、個性あふれるスタッフたちによるチャレンジ企画やインタビューなど、みなさんが楽しみながらExperience×Technologyの世界に触れていただけるコンテンツを発信していきます。