Suno AI 触ってみて気づいたこと。
音楽的なセンスが絶望的なボクでも楽曲が生成できてしまう。
すごい時代がやってきました。
前情報としてボクは幼少の頃から音楽に携わることは一切なく、当然楽譜も読めないレベルです。楽器に触れたこともありません。
そんなボクが今回取り上げるのが「Suno AI」です。
AIに触れてきた人なら一度は聞いたことがあると思います。
AIと言えば「ChatGPT」やボクも記事にしてきた「Stable Diffusion」などの
画像生成が有名ですが、最近熱いのがこの音楽生成分野です。
なにがそんなにすごいのか?
言わずもがな曲を自動で生成してくれるのですが驚くのが
そのクオリティの高さです。
一昔前、ボーカロイドというものが流行ったのを覚えているでしょうか?
もちろん今でも現役でやっている方もいるでしょう。
ボーカロイドの場合、全てが自動でというわけにはいきませんし
なにより音楽的な知識がなくては曲作りはできないと思います。
ボーカロイドの調教と呼ばれるちゃんと音に合わせて歌わせるための
訓練をし、さらに自然に聞こえるようになるまでの道のりは
想像を絶するものでした。(ボクは挫折しました)
曲作りに関しても打ち込みからやらなくてはいけないので
音楽的な知識が乏しいボクにはハードルが高過ぎました。
Sunoを使った曲作り
ではSunoではどうなのか?
めちゃくちゃ簡単です。音楽的な知識は一切要りません。
最低限必要なものと言えば「自分の作りたい曲のイメージ」くらいです。
もう少し言うと曲のジャンルとか雰囲気や使いたい音色(楽器)の
チョイスくらいでしょうか。
作詞もしなきゃいけないんでしょ?
その必要すらありません。SunoならAIで歌詞すら自動生成してくれます。
もちろん自分で作詞したものを歌わせることもできますので
自分で作詞した歌をAIに歌わせたいという要望にも応えてくれます。
Sunoに作詞させてもいいんですがもっと凝りたい方は
ChatGPTなどで作詞させたりしてもいいかもしれません。英語の歌詞にも
強いので洋楽風の曲も簡単に作れるでしょう。
実際の手順について。
・歌詞を書きたい場合、歌詞を書く。(インストにすることもできる)
何もしなければ自動生成されます。
・ジャンルを決める。プロンプト形式で何個でも選べます。
rock,rap,funk etc
・曲のタイトルを決める。何もしなければ自動生成されます。
たったこれだけでプロ顔負けの曲が作れちゃいます。
ここからは実際に数曲作った時点で気づいたこと。
v3.5(Max4minに対応)で長すぎるとOutroが怪しい。
AIによる自動生成のため思ったような譜割りや節回しができない。
歌詞をAIに作らせた場合の文字数による不自然さが気になる。
ジャンルを複数選択した場合の優先順位がわからない。
強調したい楽器やBPMが効いているかわかりにくい。
v3.5の欠点として他の方もよく言われているのがこの問題です。
歌詞の文字数を多くする(3000文字がMax)と当然曲の時間も長くなります。AIに作詞してもらうとAメロ、Bメロみたいな部分を自動で割り振ってくれるのですが曲の最後にOutroという部分が作られます。このOutroの挙動がおかしく、一度曲が終わった後に余った空白の時間に全く別のジャンルでサビの部分を作成してくっつけてきたりします。曲作りの方法として実際にあるのかもしれませんがボク的にはすごく違和感を感じました。
文字数の話。
1980年代の歌謡曲くらいの時にはよく耳にしましたが、曲の構成のお話になります。例えば最近の曲との違いに1番、2番というものがあります。Aメロ、Bメロ、サビというような構成が結構多かったと思います。こういった曲の場合、Aメロの中身を分解していくと1番も2番も同じ文字数というセオリーのようなものが存在していました。(もちろん全ての歌がそうではない)このようなきっちりとした曲を作りたい場合、作詞の段階で文字数に気を付けないと全く同じメロディになりません。Aメロ、Bメロ、Cメロ、Dメロみたいな構成になっていきます。最近の流行ではそういった曲も結構ありますよね。最後まで違ったメロディで進行していく曲。そんな感じになってしまいます。狙って作る場合はもちろんありです。
譜割り、節回しついての話。
この辺をAIに求めるのはまだ早いのかな?という気もしますけど、自動生成の弊害とも言えます。歌詞の設定をするときに改行や文字の間に間隔を入れたとしてもそれを忠実に拾ってはくれません。(拾わせる方法もあるのかも?)なので具体的な例を挙げると
Verse 2
いれたてのココア 湯気がゆれる
ぼんやり見上げる 空の青さ
いつもせわしくて わすれてたけど
小さなしあわせ ここにあったね
上記のような歌詞があったとします。Verse2というのはいわゆる2番みたいな感じだと思ってください。この構成だと4行にしてありますが、1行づつ歌ってほしいなと考え改行しましたが実際には
いれたてのココア湯気がゆれるぼんやり見上げる
までを一気に歌いきって
空の青さで切る、みたいなことも多々あります。バラードで作ったつもりがラップみたいな早口になったりすることも想定にいれておきましょう。
また譜割りについてはもう完全にAI任せになります。同じ歌詞で何度も生成してお気に入りがでるまでガチャるしかないんですけど、曲調も毎回変わってしまうので割り切るしかありません。Seed値みたいなのがあれば同じ局長で構成だけ作り直すことができるんですけどね。
プロンプトの話。
Style(作りたい曲のジャンル)のところでプロンプトが効くというお話だったんですけど、前情報にも書いた通りボクには音楽的な知識がありませんのでまず生成した曲が自分の指定したジャンルなのかがわからないという致命的な問題があります。とはいえ音楽の分類って難しいですよね。
ここでいうプロンプトとはrockだったりpopだったりわかりやすいものではあるんですけど、数曲作った感じでは一番最初に書いたものしか受け付けてないような気がします。またStyleのところで強調したい楽器や、BPMなどの設定もできるらしいのですがそれも利いてるのかどうなのかわかりにくいという点。画像生成とかだと可能な限りMixして反映するのが一般的だと思います。
生成例。
作成手順としてはSunoのメニューにある「Explore」から実際に反映されそうなジャンルが無数にでてくるので自分の作りたい曲にあったものを選択する。今回は「Kawaii Future Bass Afropiano,Kawaii Future Bass Polka」という謎ジャンルを選択しました。試験的に2種類選んでみたのですが、どちらにより近いのかはわかりません…曲のタイトル何故か2回同じものが入力されています。歌詞は今回「ChatGPT」にひな形を作ってもらいそれを添削するような感じで作りました。気を付けたことは3000文字リミットで作らせると曲が長くなりOutroがおかしくなるという話をしましたが、それを回避するための2000文字リミットにしています。2000文字にすると3分前後の曲にまとまるようです。女性Voが歌ってますがこちらの部分もランダムなのかな?とくに指定はしていません。不自然に感じるところもありますがこれはボクの経験不足によるもので、Sunoが上手くまとめてくれてると思います。