![見出し画像](https://assets.st-note.com/production/uploads/images/133717226/rectangle_large_type_2_cecc32a40cdf71728add7e2c02b85b71.jpeg?width=1200)
ボーカロイド(音声)開発
AIキャラ・AITuber Advent Calendar 2024
AIキャラ・AITuber Advent Calendar 2024様に以前投稿した記事を更新した物です
おはようございます。遠藤円です
タイトル通りなのですが、ボーカロイド(音声)を作ったのでそれの記事になります。
ボーカロイド
VOCALOIDとは、
ヤマハが開発した音声合成技術、およびその応用製品の総称。本項で詳述する。 上記応用製品に設定されているキャラクター群のこと。 それらを使用した楽曲群。詳細は「ボカロ 」を参照。 VOCALOIDとは、ヤマハが開発した音声合成技術、及びその応用製品の総称である
簡単に言うと初音ミクです。
そしてこの説明を読んで貰えると分かる通り、正確に言うと私が作ったのはボーカロイドでは無いのですが、ここでは分かりやすいボーカロイドとして説明をさせて貰います。
![](https://assets.st-note.com/img/1710232021347-p45vYmpJRv.jpg?width=1200)
中の人が居ないボーカロイド
因みに中の人が居ないボーカロイドは何人か居ます。
足立レイや無地歌が中の人が居ないボーカロイドになります。
2人の動画を参考に作らせて頂きました。
何故ボーカロイドを作ろうと思ったのか
私の開発しているAITuberの佐藤シオリの声を自作したいと思ったのが始まりです。
それとシオリの使命はクリエイターのお手伝いをして、クリエイターを幸せにする事なので、ボーカロイドにしたら、作曲家のお手伝いが出来るかもと思い作りました。
![](https://assets.st-note.com/img/1710232095874-X10m4C7hHe.png?width=1200)
元になる音
シオリの声の元を何にしようか考えた時、自分の声や友達の声とか色々考えた結果、最終的に家で飼ってる猫の声にしました。
自分の家には十匹以上猫が居るので、声を集めるのはそれ程苦労しなかったです。
猫飼ってると分かるんですが、家に帰ってくる時、餌をあげる時、名前を呼んだ時等ですぐに集まります。
![](https://assets.st-note.com/img/1710237352638-lpZzRxio93.jpg?width=1200)
調声・合声
その声を人のあ、い、う、え、お、に変換してくれるソフトがあるのでそのソフトを使って母音を作ります。
余談ですが、ピー音を合わせても母音は作る事が出来ます。
子音+母音で50音が作れるので、次に子音を作っていきます。
例えばカ行とかの破裂音は打音系の楽器の音を使えば集められるので、その集めた音を波形調整でかの子音を作っていきます。
その工程を繰り返して作った50音を理想の音声の波形と長さを見ながら調整をします。
RVC
出来た音声を次にRVCに学習されて、50音集めたら完成です。
因みに50音作るので挫折しそうな方は、何となくそれっぽく聞こえる50音で学習を回した後に、50音を自分の声で録音してから、先程作ったRVCに録音した50音を話させれば、先程作った声で50音が作れます。
恋声
まだ仕上がりが、理想と違う方は恋声を使ってピッチとフォルマント調声してみて下さい。
いい仕上がりになるまで学習と調声を繰り返して、理想の声がRVCで出せるようになったら、その声で50音のwave素材を集めて下さい。
UTAU
出来上がった50音のwaveデータをUTAUに入れたら完成です。
RVCで歌わせたい時はUTAUで合計30分程の曲を作ってRVCで学習させれば歌わせる事が出来ます。
Style-Bert-VITS2
UTAUで今度はある程度の長さの音声を出力します
出力された音声は必要なら調整して下さい。
学習に必要な数が揃ったら雑音除去をしてstylebeartvits2で学習をしたら、音声の完成です。
最近お勧めの音声
宣伝
開発中のAIなのボカロなのかVtuberなのかよく分からない物を開発中です。