見出し画像

【AI は面白い】音声変換で他人が話している音声を私の声に変えてしまう【Seed-VC】

【Seed-VC】で何ができるか。
他人が話している音声データの声が、自分の声に置き換わります。
日本語を話している音声データは高品質で私の声に変換できました。
中国語を話している男性、女性の音声データも私の声に変換できました。
流暢に私が中国語を話している!!
英語に関しても、私の声に変換できました。
英語も違和感なく聞こえます。
私の子どもにも聞いてもらいましたが、お父さんやと、お墨付き。

今までは、自分の声を学習させるために、声の録音が結構大変でしたが、今回は、30秒までの録音でかなりの高品質の変換ができました。
話す内容も適当で、
「おはようございます。こんにちは。こんばんは。明日の天気は晴れでしょう。」
など、思いついた内容を適当に30秒ほど録音しました。

録音した私の声のデータですが、声の音量が小さかったので、変換した音声データも声の音量が小さくなり、ffmpegを使って音量を上げることをしましたが、変換後の違和感がないのがすごいです。

テキストから声を自動生成すると、イントネーションが気になったり、それを調整するのが大変ですが、これはイントネーションが踏襲されるので、誰かに依頼して、話す内容を録音してもらった後に、自分の声に変換するだけで自分が話しているデータができるのは、話すお仕事をされている方は便利に使えるかもしれません。


サマークラウド株式会社の情報はこちらまで。
https://summercloud.jp

この記事が気に入ったらサポートをしてみませんか?