Stable Audio 2.0を触ってみた

2024年4月5日 00:44

Stable Audioって？

Stability AI社が2023年9月に発表した音楽生成のAI。現地時間で2024年4月3日にバージョンアップがあり、3分までの音楽を生成できるようになりました。
基本はテキストから音楽を生成。それだけでなく、オーディオファイルをインプットとすることもできます。

こちらから使用できます。
https://stableaudio.com/

触ってみました

画面はこんな感じ。

プロンプトもある程度ライブラリ化されていて、何を作っていいかわからないときはサクッとライブラリから作ってみるのもおすすめ。

1曲目：アンビエント系

ほんのりビート感のあるアンビエントポップ的な曲。音像としては悪くないですが、反復し続けてあまり動きはないですね。まぁアンビエントとしては聞ける範囲。

2曲目：スラッシュメタル

素人がイングヴェイを真似て失敗したような冒頭
ギターの譜面を忘れてたまに単音弾いてごまかしているかのような途中
リズム隊が疲れてきたころに急に自我を持つが時すでに遅いギターソロ

3曲目：ジャズ

雰囲気はいいんだけど絶妙に非音楽的な破綻をしてしまってますね。
でも何回か聞いてるとその破綻がいい味を出しているように思える瞬間もあって、意外なインスピレーションがもらえるかもしれない…と思えてきました。
この辺で少しずつ、音楽生成AIとの共存の方向性が見えてきた気がします。

4曲目：シューゲイザー

ここからが本領発揮()
※音量注意

呪詛的な女性ボーカルに乗る、浮遊感のあるゴシックな音像。
渦巻くようなギターのノイズが何度も乱した後に来る高音域の電子音。ノイズとの境界線を行き来しながらドラマチックに展開していく。
シューゲイザーというよりノイズ寄りゴス・エレクトロニカな雰囲気ですね。大好物です。
（ここまで早口）
Suno AIでも思ったけど、音楽生成AIはこの手のジャンルが意外に得意な印象を持っています。

5曲目：ポストロック

4曲目のシューゲイザーをインプットに突っ込んで、プロンプトをポストロックにしました。
※音量注意

前半の緊張感のある感じ、どこかで聞いたことある…なんだったか…
Mogwaiあたりを狙ってみたのですが、後半はハーシュノイズに近いところまで行きましたね。
前半の切ない雰囲気からの後半の轟音ノイズ。どこかのバンドがこの曲やったらきっと泣けると思います。
（ここまで早口）

6曲目：民族音楽

この辺で何となく思ったんですよ。
Suno AIと違って、"これまで存在しなかったような音楽"が作れるんじゃないかって。
いくつかの民族音楽的な要素をプロンプトに入れて作ってみました。これまでに聞いたことない不思議な雰囲気の音楽が作れた気がします。

モンゴルのホーミー的な発声とか、インド音楽のインプロ的な雰囲気とか、もっと出てくれると嬉しかったのですが…どちらかというと和によりましたね。

Suno AIと比較してみて

楽曲のクオリティ的にはSuno AIに軍配が上がると思います。
Suno AIの方がジャンルへの理解度が高く、生成される音もすごく耳障りのいいものに仕上がる印象です。

一方Stable Audioがダメかと言われると、そうは思わないです。
Sunoは良くも悪くも"耳障りの良い音"が出てくるので、平均点的な音楽に落ち着くように思っています。
Stable Audioは破綻やもろさがある分、"今まで聞いたことのない"ものが出てくる印象です。
個人的にはStable Audioの方が、インスピレーションを広げるという意味で、これまでと違った使い方が出来るんじゃないかな…と思ったりします。

もう少し触ってみて、面白い使い方を探してみようと思います。