TALQuモデル生成手順が来たので、ust書き出しでもやってみる

ustから生成する方法についても、楽にやれる方法を模索してみました。
調声すら省くので、かなり簡単に生成できるはずです。
あとはPCがついてこれるかどうかだけ。

とりあえず、いってみよう。

0.音源を準備する

好きな音源を用意してもらって構いません。
が、条件はあります。
・原音設定が適切にされていること(ずれたりしていない
・ust書き出しにおいて不足音素がない
・ノイズが極力少ないこと
この3つです。
ノートブックのほうでは、使用するUTAU音源の、原音設定の左ブランクを無音を含まないように移動、最初に休符を入れてはいけない、最後のdumyノートをいじってはいけない、と制約があるが、今から示す方法ならこれらは無視できます。 なお、「C」付きのノートの無声化音素は調声するほうが好ましいです。

1.ustを結合する

配布されている373個のustを一つ一つ調声して書き出すのは骨が折れます。
これを「僕の考えた最強のry」プラグインのust結合を利用して、すべて1つにつなげます。最新版をご利用ください。

出来上がったustを開き、もう一度「僕の考えた最強のry」の歌詞置換で「dumy」を「R」に変換します。これをしないと、そのあとに結合したustの語頭音素が続いてしまい、ピッチが狂います。

最後に、先頭に4分音符の「R」を一つ挿入し、保存、UTAUを閉じます。

2.結合したustを改造する

無音部分の切り出しを楽にするため、もうひと手間ustを少し改造します。
ustファイルを右クリック、メモ帳で開きます。
書き込まれている情報はすべてテキスト情報で編集できる形となっています。ここでテキストの置き換えを行います。

メモ帳の方はCtrl+Hで置換を起動
「Length=480」を検索し、「Length=1920」にすべて置き換えます。

HANASU用のノート配置なので、4分音符の長さをしているのは休符しかありません。これですべて全休符の長さにします。
再度ustを開いて、休符ノートがめっちゃ長くなっていれば成功です。

5/17追記
結合するとBPMが150から120になることが分かったので、ここで合わせて「Tempo=120」を検索し、「Tempo=150」に置換します。

4.ustを書き出す

まず、UTAU左上キャラクターアイコンをダブルクリック、音源の平均音程を調べます。すべてのノートを選択し、平均音程が既存のノートの真ん中くらいに来るように、ノート全体を上げ下げして調整します。

5/17追記
原音が高くなるにつれ、ノイズが乗りやすくなる?ようです。
最高音がD4に収まるくらいまでで調整すると大丈夫そうな感じです。

そこから頑張る人は調声していってください。
「C」の入った無声かノートを調声するのがだるいという方は、ここですべてを選択し、「SuffixBroker」でCを消してしまいましょう。
そしてもっとだるい人は、さらにそこからクロスフェードだけ調整してベタ打ちを書き出しましょう。

4000ノートくらいありますので、多少書き出しまでに時間がかかります。コマンドプロンプトが出るまでに少しフリーズしますが辛抱しましょう。
ここに耐えられなければust結合数をわけるか、新しいパソコンに買い替えましょう。

5.wavDividerを使ってラベリング

http://nwp8861.web.fc2.com/soft/wavdivider/index.html
ここは生声でもやった手順と同じです。
生声よりも整っているため、閾値の設定が簡単です。
ものの数分で終わるのでストレスがありません。設定はこんな感じです。

画像1

実際の録音と違い、無音部分は本当に無音ですので、閾値はこんな感じで大丈夫です。音源によっては最短無音時間を0.1くらい足してもいいかもしれません。

最初の音素「また、」だけは、短すぎて自動ラベリングに引っ掛かりませんので、手動でラベルを設定してください。それ以外は気持ちいくらいすっきり決まるはずです。
https://www.dropbox.com/s/cqpqzpbnrma0kl5/ust_name.txt?dl=0
上記のラベルを使い、一番最初のところから「ラベルの挿入」で流し込みます。

6.SoundEngineでファイルを整える

これも生声同様です。
使用するスクリプトも同じですが、貼っておきます。

[Folder Open]
FolderPath=切り出したwavのある場所のパス
[Both Ends Silence Cut]
Selection=0,-0,-1
Parameter1=-48
Parameter2=0
Parameter3=-48
Parameter4=0
[Both Ends Insert Silence]
Parameter1=0
Parameter2=0.5
[Folder Save]
FolderPath=wavを保存したい場所のパス

7.切り上がったファイルのサンプルレートを変換する

ファイルを16bit22050Hzに変換します。UTAUで書き出ししていますので、最初からモノラルにはなっていますが、サンプルレートだけは落とす必要があります。
個人的なおすすめソフトはXmediaRecordeです。

これで学習用ファイルは完成です。学習方法については、その2の記事をご覧いただくとよいかと思います。

この記事が気に入ったらサポートをしてみませんか?