SunoAIで曲作り!『歌詞だけ後から変更/思い通りのメロディ作成』
お久しぶりです。一般商材系アカウントです。前回の投稿から1年以上経過しましたが、皆様如何お過ごしでしょうか?私は最近は音楽生成AIの「SunoAI」を使用したミュージックビデオ作りにハマっております。↓これ
先日、SNSの商材系アカウントが細部グニャグニャの生成物をお出しして「超簡単!最新のAI使い方を解説!これさえあれば何でもプロ並みに作れる!」みたいな記事を書いてるのを見てムカついたのですが、久しぶりに何かnote書きたくなった私はsuno曲制作について超簡単!にまとめたいと思ったのでした。
はい、申し訳ありません。超簡単!というのは嘘です。ですがsunoAIと他ツールを使いそれなりに手間をかければ、現在のsunoでは難しいメロディ制御や歌詞変更ができましたので、その解説をします。上のMVもそのようなやり方で制作しておりますので、気になる方はどうぞご覧ください。
1.とりあえず普通に曲作り[SunoAI]
最初の工程は通常通りのsuno曲制作です。この部分は様々な解説noteで紹介されてますので割愛します。基本は「歌詞を元にランダムに生成する→気に入った部分から先をExtendで生成→…」の繰り返しです。初心者向けアドバイスとしては「歌詞の直前からExtendすると直後の歌詞がクニャクニャし易いのでできれば避ける」とか「歌詞は完璧に決めてから生成しよう」とかでしょうか。「メロディはこのままで良いんだけど歌詞を変えたい…」みたいなことになっても後から変更は難しいですからね。今回はその歌詞も自在に変更しちゃうんだけどな!!
はい、100パターンほど生成しました。Extendや新機能のcoverがあるとは言え、現在のsunoはメロディを任意で制御することができず、生成内容はランダム生成に依存しています。曲の尺も3~4分に収まる想定になっているので、それより短い曲や長い曲を作ろうとしても上手くいきません。まるで最初期のstablediffusionです。運が良ければもっと少ない試行回数で完成に漕ぎつけますし、10回ガチャればまぁまぁ良い感じの曲は出てきます。でも全体的に納得いく1曲を作ろうとすると、100は必要と見積もっています。ガチャだこれ。
一応、好きなメロディで1から生成させる方法として「イントロを自作してExtendする」、または「継承させたいサビをイントロ前にちょっと入れる」があります。
イントロ前になんかサビのカッコ良い部分がちょこっと流れる曲ってありますよね?あれです。と言っても挿入する量が長すぎると、丸々曲の前半として扱われてしまい生成がおかしなことになるので、挿入できるのは10~15秒程度でしょうか。イントロ前サビ挿入は割と打率が高く、四割くらいはサビを継承した曲が生成されます。挿入するサビは自作しても良いしsuno曲の良い感じの部分切り取って編集してsunoにアップロードしても良し。曲が完成した後は不要なイントロ前サビは削除してしまう訳です。
2.気に入ったとこを繋ぐ[audacity]
もちろん100回ガチャっても上手くいくとは限りません。その場合はどうすれば良いのか?ていうか100回もガチャらなくても完成まで漕ぎ着けるんじゃないか?その為のパワー解決がこちら↓
繋いじゃおう!
「パターン1のAメロとパターン2のサビが良い感じなので使いたい」となった場合でも、sunoには合成機能のようなものはありません。なのでいっそ手作業で繋いじゃおうという訳です。フリーの音源編集ツールのaudacityは0.001秒くらいで波形拡大して切り貼りできるので使いやすい。この画像では5パターンの生成物から良い感じの箇所を切り貼りして一曲に仕上げています。
もちろん曲調やテンポが一致している曲でなければ、繋げたところでガタガタになって違和感が出てしまいます。しかし「どうしてもここが良い感じに生成されないけど後から繋げば良いか」となれば、延々ガチャる必要も無くなります。思い通りのメロディの曲が作れる訳です。詐欺ではない。
↓波形ブツ切りで作った曲これ。
3.ボーカルと演奏の分離[Ultimate Vocal Remover]
suno曲制作の解説を見ていると「歌詞変更できないの??」という声を見かけます。公式Q&Aでも載ってましたが、「無理です><」というのが答えでした。新機能のcoverはそのようなことを目標にしているのだと思いますが、coverは変化量がだいぶ大きいので「歌詞をちょっと変更」では使えないですね。曲のアップロード上限も60秒だし。
AIイラストの細部修正でしたら、イラスト技術のある人なら持ち前のイラストツールでなんとでもなります。ですがAI曲編集となるとひと塊になってるオーディオ波形を弄れって話になりますし、DTMなどの音楽制作ノウハウとも根本的に技術が違うでしょう。
それでも何とかしたいので、下準備としてUltimate Vocal Removerでボーカルと演奏を分離させます。
完成した曲をinputしてprocessingすると分離したボーカルと演奏の音源ファイルが出てきます。聴いてみると分離された部分の音が若干クニャクニャしてますが、それでも想像してたよりはだいぶ精度高かったです。難点と言えば、バックコーラス的な声もボーカルとして分離されてしまうことでしょうか。今回はコーラスとボーカルが被る箇所がなかったので、コーラスは後でそのまま再統合しとけば済みますが。
4.ボーカルの自動MIDI化と歌詞入力[Synthesizer V]
ボーカルと演奏の分離もたいがい魔法ですが、最近は「音源を自動でMIDI化」という魔法も存在します。検索するとツールはいくつかありますが、フリーツールと商用ツールでは性能にかなり開きがありますので、今回はSynthesizer Vのボーカル変換機能を使います。ボーカル変換機能の使い方ですが、なんと10,780円用意してpro版を購入するだけです。簡単ですね。
先ほど分離させたボーカルの音源ファイルを読ませて自動でMIDI(ノート)に変換。変換精度は結構高いです。これは編集調整したものですが、なんかふにゃふにゃした耳障りのsuno分離ボーカルからの変換でも、ほとんどの部分はしっかり拾ってくれました。演奏と違和感が生じない範囲であればボーカルのメロディも変更できます。歌詞入力も手動ですので、変えたいところがあればここで自由に……、あれれ~?おかしいね?なんかボカロの弦巻マキさんが居るね?
はい、すみません。ここから完全にボカロ制作の話になってます。ですがUVRとMIDI変換を使うことでボーカル制作の8割方を自動でできるのは驚異的です。私も最初に手打ちした時はだいぶクソみたいなことになってしまいましたが、諦めてpro版に金払って自動処理に頼ったお陰で1~2時間で良い感じのボカロボーカルが作成できました。それなりの手間で自由な歌詞変更。詐欺ではない。
ちなみに演奏自体のMIDI変換は音が複雑過ぎて今のところは技術的に無理なようです。Synthesizer Vも「ボーカル変換機能」と言っとる。
5.曲の完成![Studio One]
ボーカル音源もできましたので、先ほど分離していた演奏と統合して完成です。統合の際にStudio Oneを使いボーカル音源をエフェクターで良い感じに弄ります。
そのままSynthesizer Vを使えば良いんだとは思いますが、Synthesizer Vは買ったばかりで仕様が分かってなかったので慣れてる方でやりました。ボーカルをいくつかに分割させ、「Aメロはエコーかかってる感じ」「サビはハッキリ聞こえるように」「アウトロは無線っぽい劣化した音声」「元音源のボーカルもバックコーラスっぽく再利用」など、緩急をつけています。ボカロで歌い直されたボーカルと演奏を馴染ませるにはDTMのノウハウが必要になりますが、私も上手い訳ではないのでまぁ。コンプレッサーとエコーかければ大体良い感じになるねん。詐欺ではない。
6.楽しいミュージックビデオ作り[Live2D,AfterEffects]
手間をかけて比較的思い通りの曲が完成しましたヤッター!これをSNSに上げれば皆に聴いてもらえるのでしょうか?残念ながらそうはいきません。
一連の工程は「ここのメロディはこれが良い」「歌詞はこうしたい」など作者個人の好みを叶えるものであり、それによって普通のsuno曲よりクオリティが上がるとか人にウケるとかいう話ではありません。sunoAIは誰が回してもまぁまぁ良い感じのsunoっぽい曲が生成されますので、「良いのができたよ!見て!^^」という行為に訴求性がないのです。んなことしなくても皆自分の好みの曲をガチャってます。
誰でも蛇口捻るだけで水が出てくるのであれば、水や水汲みの価値は無くなります。では蛇口から水が出てくる環境でも水に価値を持たせるにはどうすれば良いでしょうか?私は「水を丁寧にラッピングしてお出しする」が水に価値を持たせると思います。(商材系トーク)
じゃけん「丁寧なラッピング」としてミュージックビデオ作るべ。
7.ミュージックビデオ完成!
完成じゃ!!
suno曲&MV制作にかかる期間は大体1週間くらいでしょうか。製作物としてはだいぶ時間かかるので、私の平時のイラスト制作活動と比べますと作業対効果はあまりよろしくないです。でも今はあといくつかホラーMV作っていたい気分なのだ…。
では久しぶりのnoteでしたが制作解説は以上となります。
そう言えば最近話題の動画AIを利用したsunoAIミュージックビデオをSNSで見かけました。私も動画AIには注目してますし、精度向上によっては将来的に使うだろうと思っています。が、まぁ現時点では流石にちょっと色々とグニャグニャし過ぎてるかな…。アニメMV用途だと動作タイミングも完全に制御できないと不自由なんじゃ。
でも動画AIでちまちま生成して効果音つけてホラー映像作ってみたので良ければどーぞ。