
ボイチェン四苦八苦
やぁ人類の諸君。ローパーみみぃだよ。
私は見ての通り未来のダウナー系軟体美少女なんだけど、惜しむらくはボイチェンを使わないと動画を作れない特殊な体質なんよね。
でまぁ、ここんとこボイチェンでバタバタしたんで覚え書きとか初心者の方の一助になればとボイチェンの話を残しておこうと思った次第なんよ。
Voicemod
今私が使ってるのが voicemod。開発者はスペインかどっかの人だったかな?

こんな感じでアイコンが沢山並んでるけどほとんどが AI なんよね。でも、左端にあるフラスコみたいなアイコン Voicelab (有料) を使えば自分でピッチとかいじって好みの声も作れます。
なので基本的には AI で声を変えるものなんだけど、声の変換が日本語向きじゃないんよね。AI がやってくれるのは「それっぽい言葉に変換する」ことなんで英語やスペイン語とは根本的に発音が違う日本語は向いてないんだろうね。
で、自分で声のピッチ変換とかする Voicelab はわりと優秀です。ピッチとイコライザーを使えばあんまり機械音声っぽくない声になってくれる感じ。ただお値段はそこそこする。永年使用で 1万円ちょいくらいかな?私は偶々大幅値下げの時に買ったんでそこまででもなかったけど。
これを普段使いしてたんだけど、ちょっとメールの不具合で起動した時の確認コードが受け取れなくなってね、アカウントが認識されなくて有料コンテンツが使えなかったりしたんだけど、ヘルプの画面の日本語は翻訳っぽい不自然さでよくわかんないし、公式への問い合わせは英語でしなきゃなんないしで四苦八苦したんですよ。
最終的には私が X (Twitter) で騒いでたら日本公式が気づいて対応してくれたんでまた使えるようにはなったんだけどね。
Paravo
このままじゃ Voicemod がまたダメになった時に困ると思って、試しに使ったのが Pravo。国産のボイチェンです。ずんだもんや日本の声優さんの声が使えるボイチェン。

これは日本のボイチェンなので日本語で喋っても AI がかなり自然に声を変換してくれたね。
かなり惹かれたんだけど、今の AI の限界というか抑揚のある声とか感情をこめた声は苦手なのよね。なので配信する時に感情を乗っけて喋りたい人には不向きね。あと、呼吸音とかを AI が律儀に声として変換してくれるんでたまに「うー」「ううー」って突然謎の声を発したりする。私が使ってるマイクが mutalk っていうジョセフ・ジョースターがつけられた呼吸矯正マスクみたいなヤツだからどうしてもブレス音がしやすいのよね。

バ美声
最後に行きついたのがバ美声。日本産の超シンプルボイチェン。
ピッチをいじれる程度の簡単ボイチェンなんだけど、voicemod でも結局ピッチぐらいしかいじらないからかなりいつもの声に近い声が出せたのよね。価格が BOOTH で買い切り 2,000円とお安いのも嬉しい。

結局 voicemod が復活したから体験版を使っただけで購入は見送ったけど、これはかなり有りだと思う。
まとめ
ということで私は「せっかく購入したし」ってことで voicemod を使うけども、これからボイチェンを選ぶ方は自分がどんな動画を作りたいか、どんな声までなら許せるかで選ぶといいと思うよ。
AI系は自分の言語に近い国のものを選ぶ。声の抑揚はつけにくいし感情は乗せにくい。その代わり言語は明瞭になるので多少喋り声がこもった感じの人でも聞き取りやすくなる。
自分でピッチをいじると感情を乗せやすいし自分が出そうと思った雰囲気の声を出しやすいので配信向き。ただ自分の発声スキルに大きく左右されるのでピッチを変えるともっと聞き取りにくい声になることもある。
そんな感じだね。
欲を言えば自分の声を感情や抑揚も含めて完全に違う声に変換できるボイチェンができると良いんだけどね。技術の進歩を待ちましょう。