『AI作曲「Suno」V3.5で4分対応。長い曲を書かせるコツと楽曲AIで新規ビジネスのアイディア』～【web3&AI-テックビジネスのアイディアのタネ】2024.5.29

2024年5月29日 10:54

「先進テックで未来の生活はもっと良くなる！」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。

新規ビジネスのアイディアのタネがほしい方、未来を想像してワクワクしたい方、読んでちょっといいなと思った方、ぜひフォロー・高評価よろしくお願いします！

■AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox）

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

バージョン3.5のEarly Access版（有料プランユーザーのみに提供）を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。

Sunoが作詞作曲＋歌えるようになったV3にバージョンアップしたのが今年の3月末。あれからわずか2か月でV3.5になり、実用性が大幅にアップしました。

V3→V3.5の特長
・生成する楽曲の長さが2分→4分まで拡大。
・曲のエンディングまで生成できるように。
・日本語の歌詞の漢字を読み間違うことが減った。でもまだ間違う。
・16bit 48kHzのWAV保存が可能に。
・体感ですが、V3より生成時間が短くなった気がする。

Suno V3.5は現在では「Early Access」として有料課金ユーザーのみに提供されています。

V3の時に課金して、うっかり自動延長されてしまったので私はV3.5が今使える状況です。なので後ほど実際に生成させてみるテストをやってみますが、自動延長型のサブスクは退会を忘れないようにしましょう・・・

UdioやStable Audio、GoogleのMusicFXなど、Suno V3の後に話題になった楽曲生成AIが多数ありましたが、日本語の曲はSunoの独壇場であることは今でも変わりません。

Sunoは一発生成に強い

Udioの生成後の部分修正機能は便利ですし、できればボーカルや楽器をトラック別に分離できる機能も欲しくなりますが、これらは生成後の追い込み作業をする人向けの機能。

ライトに一発生成するだけなら4分エンディングまで破綻なく生成できるSunoは、その一発生成での完成度は非常に高いと感じます。

再びモリプトタツヤのnoteのテーマ曲を作らせてみた

V3登場の時にもやった、このnoteの冒頭のフレーズを使ってSuno V3.5にテーマ曲を生成させてみました。

「先進テックで未来の生活はもっと良くなる！」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。

noteで未来想像記事を書いているのに語呂を合わせて「未来の音（未来note）」というタイトルをつけてきたのはナイスです。

しかし1分30秒くらいの短い曲として生成されました。
プロンプトが短すぎるとダメなのかも？

ではGPT-4oに歌詞を延長してもらいましょう。

「「先進テックで未来の生活はもっと良くなる！」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。」という文章を、4分以内のJ-POPらしい曲の歌詞に膨らませてください。

もちろんです。以下の歌詞は、J-POPのスタイルで、先進テクノロジーが未来の生活をより良くすることをテーマにしたものです。

サビ：
先進テックで未来は光る
Web3・AI、夢が広がる
新しいガジェット、手に取り感じる
毎日が輝く、僕らの未来へ

Aメロ：
朝日が昇る、画面を見つめ
最新ニュースが心を躍らせる
Web3の世界、繋がる心
デジタルの波に乗って、僕らは進む

Bメロ：
AIが教えてくれる、新しい知識
ガジェットが手元で、奇跡を描く
毎日一つのニュースが、未来の地図に
僕らを導く、光の道しるべ

サビ：
先進テックで未来は光る
Web3・AI、夢が広がる
新しいガジェット、手に取り感じる
毎日が輝く、僕らの未来へ

Cメロ：
目を閉じてみれば、見える未来
技術が繋ぐ、心の絆
Web3の波に、希望を乗せて
一歩ずつ前へ、夢の向こうへ

サビ：
先進テックで未来は光る
Web3・AI、夢が広がる
新しいガジェット、手に取り感じる
毎日が輝く、僕らの未来へ

アウトロ：
毎日一つのニュースが、未来を照らす
僕らの心に、希望を乗せて
先進テックで、もっと良くなる
明日の生活、未来の光

この歌詞が、J-POPらしい楽曲にぴったりだと感じてもらえると嬉しいです。

このGPT-4oの万能さに驚かされます。これをプロンプトとしてSuno V3.5に食わせてみましょう。歌詞がある時はCustomメニューを使います。

やはり歌詞が長ければ長い曲を作るようです。今回は3分ほどの曲になりました。

「先進テック」を「さきしんテック」と読んだり「Web3」を「うぇぶさん」と読む癖が抜けなかったのは気になりましたので手作業で歌詞を修正しました。

また、GPT-4oが書いた歌詞の問題ですが、歌詞が字余りっぽくてリズムに乗っていない印象です。もう少し歌らしくなる歌詞が必要で、これはまだ人間に一日の長がありそうです。

「そうだ京都、行こう。」もV3.5で再生成

前回V3で生成した「そうだ、京都、行こう。」

これをV3.5で再生成させてみます。

こちらも長い曲になるように、事前にGPT-4oに4分程度になる歌詞を生成させて、それをSuno V3.5に食わせる方法で生成しました。

ジャケ写が前回より京都らしくなりましたが、京都から見えるはずがない富士山が一緒に描かれているのは間違ったジャパン観ですね。

こちらも歌詞が長くなったぶん3分を超える曲になりました。
歌い出しがちょっと変な印象ですが、エンディングの締めくくりがちゃんとしています。

2曲目の方がお気に入りです。

英語版「Let's go Kyoto」

グローバル向けに英語版も作ってみました。ジャケ写もSuno上でプロンプト入力で生成できるので、ジャパニメーションな女の子を入れてみました。

生成される楽曲や歌い方は英語版の方がイイカンジになることが多い印象です。学習量の違いでしょうか。

GPT-4oの「4分以内の歌詞」生成が秀逸だった

Suno V3.5のエンディングまでしっかり作れる4分延長で実用性がグッと上がったことを実感できましたし、生成される曲のクオリティは相変わらず圧倒的ですが、4分の曲を生成させるためには長い歌詞が有効だということがよくわかりました。

その4分以内の歌の歌詞を作るGPT-4oの能力に驚かされたのが今回の大きな収穫。

[サビ]
そうだ、京都、行こう
心の街、夢の場所
そうだ、京都、行こう
歴史の風、感じよう

[Verse 1]
街のざわめき、離れて
静かな風に、包まれて
石畳の道、歩けば
懐かしい顔、思い出せ

[Verse 2]
四季の色が、輝いて
山と川が、歌い出す
桜の花びら、舞い上がり
秋の紅葉、色を変え

[サビ]
そうだ、京都、行こう
心の街、夢の場所
そうだ、京都、行こう
歴史の風、感じよう

[Bridge]
祭りの夜に、灯る光
祇園の街に、響く音
古都の愛が、胸に響く
千年の時を、越えてなお

[Verse 3]
夕暮れ時に、染まる空
古いお寺が、見守って
雪の舞う冬、静かな夜
京都の風が、包む夜

[サビ]
そうだ、京都、行こう
心の街、夢の場所
そうだ、京都、行こう
歴史の風、感じよう

[Bridge]
音の響きに、心躍る
灯籠の道、照らす光
過去と未来が、交わる場所
京都の風が、包むよ

[Verse 4]
春の桜に、恋をして
夏の夜に、夢を見て
秋の紅葉に、心躍り
冬の雪に、温もりを

[サビ]
そうだ、京都、行こう
心の街、夢の場所
そうだ、京都、行こう
歴史の風、感じよう

[Outro]
またいつの日か、帰る場所
古都の温もり、忘れない
そうだ、京都、行こう
心のふるさと、夢の中へ

祇園、石畳、紅葉、古都、歴史など京都らしいワードをちりばめるのもうまいですし、[Verse 4]など春夏秋冬を1行ずつ歌詞にしてきているのもうまい。

今回は「韻を踏んでリズミカルに」という指定をしたのも歌詞らしい歌詞になった要因だと思います。あまり複雑な韻の踏み方ではありませんが、

「恋をして」「夢を見て」、「京都、行こう」「感じよう」は韻を踏む指示を意識したのかなと思わされます。

前述のとおり字余りっぽい歌詞になりがちなのが未完成に感じる部分ですが、もっと作詞の仕方に特化して学習したら、本当に音楽業界に激震が走りそうです。

AIならではの音楽サービス案

また、人間ではできない高速大量生成という能力を活用したサービスも現実的になってきました。

たとえば日記のように自分のためだけに毎日歌を作ってくれるだとか、歴史暗記のために大量に語呂合わせ曲を作るだとか。業務日誌や営業日報を曲にしてくれると仕事がちょっと楽しくなるかもしれません。

実用的なところだと、車でロングドライブ中に、通過中の位置情報に合わせて地元ソングを作り続けてくれるサービスなんかもよさそうです。自分の好みの曲風に統一してくれるのもいいですし、ヨーロッパのように言語圏を横断しながらドライブするシーンでは地元ごとの言語で歌ってくれるのもおもしろそうです。

将来マルチモーダルな入力に対応してくれば、スマホで日々撮っている写真に合わせて作詞作曲してくれるのもよいでしょう。

インスタに投稿された写真を見ると、写真に合わせた曲が付いているだとか。結婚式に子どもの頃からの思い出の写真をスライドショーにして、有名なラブソングなんかをBGMにして流すことがありますが、あれを写真に合わせたオリジナル楽曲にできると趣も変わりそうです。

これだけ曲作りがカジュアルになると、音楽の使われ方や消費のされ方も大きく変わり、音楽を絡めた新規ビジネスもたくさん生まれそう。これはワクワクします。