【学習編】RVCを用いたリアルタイムボイスチェンジを1から解説してみる
はじめに
この記事は【準備編】RVCを用いたリアルタイムボイスチェンジを1から解説してみる、【学習セット用意編】RVCを用いたリアルタイムボイスチェンジを1から解説してみるの続編です。まだ読んでない人は準備編から見てね。
RVC-betaフォルダのgo-web.batを起動するとコマンドプロンプトが起動し、ローカルホストでweb-uiが起動します。
起動したら训练タブを開きます。
step1
输入实验名は完成したモデルの名前になります。分かりやすい名前にしましょう。
⚠スペースをいれたり'をいれたりした場合、その後の輸出信息にで不具合が発生するようです。数字とアルファベットのみの名前だと問題なく機能します。
目标采样率は学習セット用意編に合わせて48kにしましょう。
模型是否带音高指导(唱歌一定要,语音可以不要)は是にすると歌えるっぽいです。
step2a
输入训练文件夹路径は学習セット用意編で書き出したwavファイルが入っているフォルダをShift+右クリックでパスのコピーをして貼り付けます。
请指定说话人idは0でOK。
パスの指定ができたら、处理数据をクリック。輸出信息みたいなやつにwavファイル名>Suc.が並んでいたら問題ないです。
step2b
グラボとCPUの設定です。
グラボが1枚なら0、複数枚あるのであれば処理に使うグラボを指定します。グラボの番号はタスクマネージャーのパフォーマンスから確認できます。
その右で学習に使用するCPUの論理プロセッサ数を指定します。論理プロセッサ数もタスクマネージャーのパフォーマンスから確認できます。下の画像の○で囲ってある部分です。
また、step1で是を選択した場合は、pm,harvest,dioを選択することができます。harvestが強いらしいです。
その後、特征提取をクリックして、輸出信息に結果の出力が完了したらstep3に行きます。
step3
最後に、学習時の設定をします。
save_every_epochは学習が中断された時のために取るバックアップの頻度です。
total_epochはどれだけ学習させるかを表します。
batch_sizeは一度にどれだけの処理をさせるかです。増やすと学習が早く終わります(PCのスペックと要相談)。
次のやつは是推奨です。是にするとsave_every_epochで保存したファイルの最新のもの以外が自動的に消えます。
他はデフォルトでいいので一键训练で学習開始!!!!
あとは待つだけでRVCのフォルダの中にあるweightsフォルダにファイルが生成されます。
おすすめのパラメータ
学習セットの無音切り詰め後の長さが10分、スペックが私のPCくらいの場合
save_every_epoch:10
total_epoch:50
batch_size:12
学習セットが少ない場合はtotal_epochを増やしましょう。
スペックが低い場合、batch_sizeを落とします。
このパラメータでできた音声
以上で学習編は終わりです。お疲れ様でした!
次はリアルタイムボイスチェンジ編です。あとちょっとです、頑張りましょう!