CeVIO・VoiSona楽譜入力のコツ:①ノートの長さ
※この記事は「いぬいぬ流CeVIO・VoiSona楽譜入力のコツ」の7つ目の記事です!
楽譜入力のコツ
ここからは具体的なコツの手法について細かく書いていきます!
楽譜入力のコツ①:ノートの長さ
人間が歌う用の楽譜と同じように、ノートを打っていきます。…いい?「人間が歌う用」よ?
短いノートは基本的に避ける
具体的にいうと、人間が歌えない・歌いにくい短さのノートを打たない様にします。
曲のテンポにもよりますが、
・1/32の長さのノートは避けましょう。
・1/16の長さも、いぬいぬ的には怪しい!です。
CeVIOやVoiSonaのノートは、長くする分には比較的、
ダイジョーブ博士フォッフォッフォッなんですが、
短くする方は気を付ける必要があります。
短すぎるノートがあるとどうなるかというと、
ノイズになったり変な発音になったりします。
CeVIOやVoiSonaのソングエディタはクオンタイズ 1/32 って制限があるのは、長さが短すぎるノートを入力されないためらしいです。ただ、1/32に制限してもダメな時もあるんですよね…。
理由:
CeVIOは喉のシミュレーターなのでどうしても自然に発音するための最低限の時間が必要
歌詞によって必要な時間が違う
(音素によって発音に必要な長さが違う)
早口が得意なボイスと苦手なボイスがある
32分音符と言ってもテンポでホントーの長さが変わる
(絶対時間じゃなくて相対時間なので目安でしかない)
短いノートが続く時、子音の発音タイミングは前にめり込むから
たとえば、「あ」と「さ」では
「あ」:[a] (母音だけ)
「さ」:[s,a] (子音+母音)
なんで、当然「さ」の方が発音に必要な時間が長いです。
子音+母音の音でも、破裂音(カ行・ガ行・パ行など)や破擦音(チャ行やツァ行)、長子音(日本語だと「っ」や「ん」)は必要な時間が長くてそれ以外の子音(短子音)は必要な時間が短いらしいです。
さらに音と音の繋がりの部分はスパッと切り替わるんじゃなくて、グラデーションな、どちらの音でもない部分が生まれます。特に、子音と母音の間にこの音がないと聴き取れなくなってしまうことがあるそうです(「フォルマント遷移」の有無)。なので、前後に間のある母音1つだけの”ボッチな”ノートじゃない限り、その音の長さ分の時間も必要です。
短いノートが続く場合、影響が大きくなります。
元々、ノートぴったりで聞こえるタイミングというのは、母音の開始位置とノートの開始位置がピッタリの場合です。ノートピッタリに発音させようとすると、子音の開始位置は、とーぜん!前のノートの母音部分にめりこみます。
子音はある程度の長さが必要なんで、前のノートの母音の長さを削ることになります。短いノートが続く場合、長さの余裕がないので、こういうことが起きます。
子音の長さが足りなくて聴き取れなくなったり…
母音の長さが減って母音脱落っぽくなったり…
かろうじて確保した長さで音はでるけど歌えなかったり…
つまり、ピッタリにしようとすれば逆に不自然になります。
上の図のように、AIの自動推定そのままの場合は、早口の場合の人間の特徴を拾って、母音開始位置がタメ気味に後ろに遅れます。
だからといって、ここでノートの長さを調整したり、TMGの調声をめちゃくちゃやる…、のはダメです!
そもそもノートの割り方を見直しましょう。
こーゆー、同じ音階で1/32や1/16のノートがつづく、
早口で歌う場所は、
1つのノートで再現します。
一見、タイミングが全然あっていない様に見えて、
聞くと違和感が意外とないです。
短いノートの短い時間制限の中で、発音の時間を確保して、しかもノートの始まりや終わりに無理やり合わせようとするより、複数のノート分の余裕ある長さの中でAIに自動調整してもらった方が自然な発音になりやすいです。変な発音が生まれることが減ります。マジで。
もちろん拍に合わせたリズム感は減るんで、ここからさらにTMGによる調声がいるんですが、ノートを割ってあるより、「準備運動」としてはこっちの方がやりやすい…という感想です(ノートを割るとTMGの線が増えることがあったりするんですよね…)。変な発音を直すっていうマイナスをゼロにする作業を最初にやるんじゃなくて、
リズム感を足すっていうゼロをプラスにする感じの作業になるんで。
実際の人間の歌手の早口の部分も、(その人の歌い方によりますが)ノートのタイミングを無視して続けて発音してることも多いです。実際の歌手の人は、いい感じに音符を繋いだり(楽譜を無視して読みかえたり)、音を飛ばして発音しなかったりして、発音の長さを確保してるようですね。なので、ノートぴったりに合わせると、逆に人間っぽさが減ったりします。頑張ってピッタリになるようにいじったけどそのままノータッチの方が良かった、ってこともわりとよくあります…!
この辺の譜割りのコツはあとの記事でも触れる予定です!
短いノートは発音の枷(かせ)になりやすい
短いノートは、発音するときに逆に制限になって上手く歌えないことが増えます。
CeVIO(ソングだけでなくトークも)やVoiSonaのエンジン部分は、喉のシミュレーターなんで、こういった物理的なところが影響します。
短い長さのノートは人間が歌えない長さの可能性がある
=CeVIOやVoiSonaも上手く歌えない、
と思ったほうがいいですね。。。特に連続する場合は。
ボイスによっても差が出ます。元の学習した歌唱データがゆったり目だと、早くて細かい短いノートは、(たぶん)歌ったデータがないので上手く歌えません。たとえば結月ゆかり麗ちゃんやAIささらちゃんはこの傾向があります。
推奨テンポがゆっくり目のボイスの子は特に注意が必要です。エンジンの特徴というよりはボイスの特徴の影響の方が大きい印象です。学習につかってる楽譜の差なのかな…?
目安として1/32や1/16以下のノートになってる時は、怪しいと判断できます。実時間じゃないし、ボイスによって得意不得意があるので本当に目安でしかな~い!んですが。
逆に1/8とか以上の発音に余裕のある長いノートは普通にそのままでOK。
※まあ、この長さでもできなくもないですけど、タイミングがほとんど手動になるんで、TMG調声がめっちゃ大変になります。ポエトリーとかトークロイドやりたいなら使えます。
人間の歌手がやってるみたいに楽譜の読み変えとか、いい感じの音飛ばしまでやってくれたら便利なんですけどね~~。
でも、実現は難しそうです…。楽譜通りに歌ってそうなのか、読み変えてるのかなんてその歌手本人にしかわからないですからね…!
まとめ
1/32の長さのノートは避けましょう。
1/16の長さも、いぬいぬ的には怪しい!です。
同じ音階で短いノートが続く場合は、1つにつなごう!
人間の歌手みたいな楽譜の読み変え・歌詞飛ばしまでは
やってくれないので手動で
ミニもくじ
前の記事「楽譜全体の指定③:テンポ・拍子」
次の記事「楽譜入力のコツ②:ノートの位置」