SunoAIで自動作曲するための歌詞をChat-GPT等色々なAIで作って比較検討してみた。
近年、自動作曲システムにおける歌詞生成において、ChatGPTやGeminiのような大規模言語モデルの併用が注目されています。これらのツールを効果的に活用することで、歌詞の完成度を飛躍的に向上させることが期待できます。本稿では、テキスト生成AIを比較検討し、それぞれの強みや弱みを明らかにすることで、自動作曲システムにおける歌詞生成における最適なツールの選定に役立てていただきたいと思います。
1.はじめに
Noteにおいては仕事柄、グラフィックの話題が多いのですが、今回は音楽についてです。実は昔、有機生命体というバンドを首謀していて、その流れからローカルテレビのCMソングを仕事として作っていた時期があります。
この流れで現在は熊本の平成音楽大学でも教鞭をとっていますが、最近の自動作曲システムの進化には脅威を感じています。とはいえ、作曲の技術がなくても音楽が作れる状況になったということは素晴らしい事です。
それでは作曲する際にどのテキスト生成AIを使って作るほうがいいのか考えてみましょう。
2.どんな曲を作る?
どんな曲を作るのか200文字以内で指定する基本の文章を考えましょう。この200文字というのは Suno AI において、曲の概要欄にいれる文章としての最大値です。
今回はラブストーリーのプロットを Chat GPT に考えてもらいます。それを元に出来た概要文が下記です。
ただし、人名が入っていると Sumo AI は盗作リスクから作曲してくれません。また、曲調の指定もないので下記に変更してその基本としましょう。
プロット自体をAIに考えさせれば便利ですが・・・唄を作るという根本的な行為そのものの否定にもつながるのがちょっと心配です。でも、便利だからまあいいか。
3.SunoAIのオリジナル
まずは上記概要文をそのまま入力して、とにかく作ってみましょう。
それで出来たのがこちら
1.SunoAIによる作詞作曲
タイトルや画像もダサいっすね。あははは、でも曲自体は悪くないので、作らた歌詞を見てみましょう。
AIが作ったものとしては十分にいい作品ですが、どうしても歌詞全体に抑揚がなくて、全体として平坦な感じなのと、単語の選び方があまりにあリがち過ぎたり、逆に硬すぎたりと凸凹です。
最終的に何が言いたいのか伝わりづらく雰囲気だけの詩に成っています。
2.Google Gemini
それでは Gemini にて先程の概要文から歌詞を作らせてみましょう。
夏祭り花火と恋の予感
いきなり結論から入るというのは結構面白い感じもしますが、もう少し焦らして結果に持っていったほうがいいかもですね。言葉の選び方は悪くないと思います。
それにて作られた曲がこちら
3.Chat GPT-4o
続いては、ChあtGPT-4oによる作詞。
花火と恋の予感
悪くはないですね・・ただまだ言い回しがありがちで、少し陳腐な気がします。生成した曲がこれです。
4.Microsft Copilot
花火と恋の予感
基本的にCopilotのエンジンははChat GPT-4 を利用していますので、先の Chat GPT-4o と印象は近いです。歌詞はわかりやすいのですがわかり易すぎる感じがします。
5.Cloud 3.5
Chat GPT を超えたのではないと言われているテキスト系GAIですが、最近3.5にアップデートされモーダル系のデータも扱えるようになりました。
なかなか比喩的な表現に優れたものがありそうです。言葉の流れも自然でいいですね。その上歌いやすい字数的な配慮もあると思います。
4.結論
各テキスト生成AIではそれぞれの特徴がありますが、断定できる違いというのはあまり確認できませんでした。その中でも Cloud 3.5 は歌詞のベースにするのには優れているのではないかと思います。
次点は Gemini だと思います。もちろん Gemini でも良いフレーズを書き出してくれることは沢山あるので何度か書かせてフレーズのリスト作ってもいいですね。
音楽の歌詞は、主観的な価値が最も重要であり、表現方法は人それぞれです。最終的には、制作者の思いがどれだけ込められているかが重要になります。そのために、いくつか注意すべき点をまとめました。
1. プリントアウトして確認する
画面上だと全体を俯瞰しにくいため、一文の問題が見えにくくなります。候補となる歌詞は一度印刷して、比較検討することをおすすめします。
2. 多種のAIに並行して生成する
単独のAIだけを参考にするのではなく、生成プロンプトなどを少し変えて多元的に作成し、比較検討しましょう。
3. フレーズを整理して混ぜる
実際の歌詞の中で、メインフレーズ(サビに持ってくることが多い)を確定し、配置を意識しましょう。
4. 字数を意識して合わせる
実際に歌うことを前提に、字数を調整することも必要です。
5. 硬い単語の使い方に注意する
曲の雰囲気に合わない場合は、別の単語に差し替えましょう。
6. 最後は自分の感性で
最終的には、制作者自身が微調整して流れを作り変えるべきです。間違いなく、そのほうが良い歌詞になるでしょう。
5.感想
以前、仕事で音楽を作っていたときは、楽器が弾けなかったこともあり、音楽を作り上げるのにとても時間がかかり、「音楽を一生の仕事にするのは無理だ」と考えていました。
また、時間をかけて作ってもそこそこの曲しかできないという現実で、毎回ちょっと落ち込みながら仕事していたのです。ただ救いはありました。
「だって、作れるだけましじゃん!多くの人は音楽なんて作れないんだから!」と。
しかし、この救いは自動作曲システムによって崩れました。誰でも作れるじゃん!!!!
クソ!そうやって音楽は消費されるだけの存在に・・・・失礼しました。
後ろ向きなことを言っても仕方ないですね。
それより、この素晴らしいクリエイティブツールの存在を喜び楽しむべきです。楽器が弾けなくても録音できなくても歌うことすら無理でも、名曲を生み出せる時代です。すげーわ。
6.サンプル曲
さて、色々比較検討する為の情報は書きましたが最終的にどんな歌詞がいいのかはやはり主観に左右されることから書かずじまいだったわけですが、歌詞に関してはプロの腕前とまではいかないのですが、一応自作の曲も何曲かさらしておきます。
モノクロームの日々
ネットで知り合った知人が忙しそうだったので作った曲。各AIの生成データを元に最終的には自分で3割り程度書き直しています。
海の音
ほぼAIの歌詞なんですが、読み間違いなどの文字を変更しています。まだ少しメロディーに合わせるために読み違いがありますね。日本語の歌詞として文章の整合性よりそれぞれの文節の文字数などを優先させました。
朝霧の山道をゆく
半分以上の歌詞は書き直していますが、この曲は表現したいことがはっきりしていてそのために作ったんですが・・・いやぁまだまだです。雰囲気は出ているのですが、十分に練られた歌詞には成っていないですね。100回近く作り直しましたが、難しい。
お助けDXラボ!
ちょっとふざけた曲なんですが・・DX関連のコンサルのチームやってて、作ってみました。基本はGeminiで作らせましたが、「ユーモアを交えて」的なプロンプトで書かせたんですが、結構笑えるかも。
サムネイルの画像は Midjourneyで作っています。ほんとすごい時代だよねー。