#148 音楽生成AIの使い方概要と手軽さとすごさをお話しします

2025年1月9日 17:00

※当記事はこちらのポッドキャストの内容を編集／再構成したものです

今回はややエンタメよりの内容を話したいと思います。

最近、生成AIがたくさん登場してきていて、対話型のAIとしてのChatGPTとか、画像生成AIのMidjourneyとか、YouTubeや文章コンテンツなどあらゆるものをマインドマップとして要約してくれるMappifyとか、とにかくいろいろな分野においてAIが登場していて、「これまでの作業は何だったんだ」というぐらいに、いろいろなものを自動で作ってくれたり、いろいろな役割を担ってくれたりしています。

この生成AIの流れはもちろん音楽にも来ていて、ボタン1つで音楽が作れる時代にもうなっています。

それも、なんとなく不完全なものではなく、本当に品質が高くて、人間が何時間もかけて一生懸命作ったようなクオリティの音楽をほんの数秒から数十秒で作ってしまいます。

＊

音楽生成AIとして特に有名なのが「Suno」というサービスと「Udio」というサービスです。最初に登場したのが「Suno」で、後発として「Udio」がリリースされました。

これら以外にも、最新の情報として音楽生成AIは探すといくつか出てきます。おそらく今後もいろいろなサービスが新たにリリースされていくはずです。

これらのサービスの使い方やその挙動は基本的には似ていて、いわゆる「プロンプト」と呼ばれる、音楽生成のための命令を英文によって指定された入力欄に入力します。

音楽ジャンルとか、音楽が持つ雰囲気とか、そういったものです。

ポップスとかロックとかヒップホップとか、もう少し込み入ったところでいえば、「90年代のイギリスのロック」とか、「ローファイな雰囲気を持つオールドスクールのヒップホップ」とかそんな指定もできます。

雰囲気は、「ダーティ」とか「爽やか」とか「都会的なサウンド」とか、そんな内容を命令文として指定できます。

それを英語にして入力します。「Lo-Fi old school hip-hop style」とか、そんな感じです。

さらには、その楽曲を歌のある曲にするのか、歌のないインストにするのかという指定もできます。

歌のある楽曲にする場合は、先ほど言った楽曲の雰囲気を指定するプロンプトの入力欄の他に、歌詞を指定する入力欄があるので、そこに、例えば「Aメロ」「Bメロ」「サビ」のような各セクションに分けて、どのような歌詞をそのAIに歌わせるかという歌詞そのものを実際のテキストで入力します。

具体的には、「Aメロ」という風に見出しをつけてその下にAメロで歌わせるべき歌詞を入力する、その後に「Bメロ」という見出しをつけて、その下にBメロで歌わせるべき歌詞を入力する、というようなやり方です。

歌詞がない場合は、現状では英語の歌詞になりますが、「歌詞の自動生成」というボタンをオンにすることで、歌詞を自動生成してもらうこともできます。歌のないインストを生成する場合は、歌詞の入力欄は必然的に機能しなくなります。

そんなやり方で、プロンプト入力が済んだら後は楽曲生成のボタンを押すだけです。

すると数秒から数十秒で音楽が作られ、作られた音楽はブラウザ上で再生ボタンを押して即座に聴くことができます。

＊

作られる楽曲が自分のイメージした通りのものになるかどうかは、プロンプトにかかっているともいえます。とはいえ、ある程度細かく雰囲気を指定することでそこそこの割合で自分のイメージに近い楽曲を生成することができます。

そしてそのクオリティは、冒頭で言ったようにかなりレベルが高く、これを全て自分で作ろうとしたら相当なコストがかかるだろうなと思えるような楽曲を瞬時に生成してきます。

ここでいう「コスト」というのは、時間的にも、労力的にも、例えば誰かに専門的な作業を依頼するなら金銭面でのコストもそうです。

それらを全て通り越して、すごく品質の高い音楽をたったそれだけの操作ですぐに生み出してきます。

冒頭で言ったとおり、現状で話題に上がっている「Suno」と「Udio」のうち、後発にあたる「Udio」の方が音質が良いとされています。

ただ実際に使ってみた個人的な感想からいえば、「Suno」も随時アップデートをしていて、最新のアップデートではそこそこ良い音質になっていると感じました。特に歌なしのインストであれば十分に使える、と感じます。

そして「Suno」と「Udio」、どちらも楽曲生成にオプション機能のようなものがあって、作った曲をさらに細かくいろいろといじれたりします。

中でも「Udio」の方にあるリミックス機能で、手持ちのオーディオ音源をもとにそれを「Udio」が指定された内容に応じて自動でリミックスをしてくれたりします。

それによって「Suno」で生成された楽曲のメロディをそのまま活かしながら、より音質の良い「Udio」でリミックスをして、音質面で、音源の品質向上ができたりもします。

どちらのサービスにも言えることですが、作られた音源はMP3などの音声データとしてダウンロードができます。

そして、それらサービスを無料で活用しているうちは著作権はサービス側にあり、そこに課金をすることで著作権が利用者に移ります。

つまり、それらのサービスに課金をして楽曲生成によって作られた音源をダウンロードすれば、それを自分に著作権がある音源データとしてそのままあらゆるところに活用できるということです。

当然、例えば先ほど言ったリミックスサービスなどに誰かが作った音楽を活用したりすれば、その音楽は100%自分の著作物とは言えなくなってきます。その点で著作権には十分に注意をすべきです。

でも、例えば完全にゼロからそれらのサービスだけを課金して活用して作った音楽であれば、著作権は自分にあることになります。

料金は、無料から始まって、無料ではさきほど言ったように著作権がサービス側にあり、そして無料プランでは楽曲生成に使えるクレジットも少なく、作る曲数が数曲程度でクレジットを全て使い切ってしまいます。

それ以降は有料プランという扱いになり、月々の課金としてだいたい10ドルぐらいからスタンダードプランが始まります。有料プランでは先ほど言ったように著作権がサービス利用者に移り、サービスを使って作られた音源を自分の著作物として自由に使用できるようになります。

そして、有料プラン加入によってクレジットの数がものすごくたくさんもらえるので、ひと月あたりたくさんの楽曲を生成できるようになります。

つまり日本円で1500円ぐらいをひと月に払えば、音楽生成AIのサービスを使ってものすごく音楽的にも質が高くて、音質も良い音源を、ある程度自分のコントロール下のもとに、自分の著作物として何曲も作れるようになる、ということです。

＊

まだ使ったことがない場合、もし興味があれば実際に今ご紹介した「Suno」と「Udio」どちらでも良いですが、使ってみるとその凄さに驚くはずです。

そしてここまでの品質を持つ音源をこれだけの簡単な操作でこうも簡単に作れるとわかるほどに、今後自分がミュージシャンとして音楽活動をしていく上で、どのようなことを打ち出していくべきか考えさせられます。

現時点でこれだけのクオリティなので、これから5年10年と時間が過ぎていくごとにもっと色々なサービスが登場してさらにクオリティが上がり、もっと簡単にもっと高品質な楽曲を自分の意図する通りに低価格で作れるようになっていくはずです。

それを考えると、今後の音楽業界として、どんな立ち位置にいるミュージシャンが重宝されて、反対にどんな立ち位置にいるミュージシャンの価値が下がっていくかというところがある程度予想できます。

さらには、課金をすれば著作権が完全に自分に移るというところから（しかもその課金も、ものすごく高額ではなく月々1500円とか2000円程度であれば）、自分自身で全くメロディを考えなくても、楽器が弾けなくても、これらのサービスを活用してオリジナル曲を作るようなアーティストが出てくるはずです。

むしろもう現在、これらのサービスを活用しながらミュージシャンとして活動している人がかなりの数いるはずですし、私自身も実際にそうやって活動している人を見かけることが増えてきました。

この「音楽生成AI」に関しては、人間が表現する音楽の価値とか、職業として音楽業界に携わる人がどうとか、リスナーはどういったものを聴くようになるのかとか、いろいろな見方ができます。

独立系ミュージシャンとして、実際に自分自身が音楽活動をしていく身であればなおさらそのあたりについては、ある程度理解を深めておく必要があると私は思っています。

だからこそ、実際にこれらのサービスを使ってみたり、状況によってはそれを自分の音楽活動に取り入れてみたり、それを踏まえてミュージシャン自身として今後の音楽業界や、一般的な聴き手のみなさんの音楽を聴く環境がどう変わるかなどを予測して、それに対して自分がどんな行動を取れるかという点を考えたりしながら柔軟に対応していくことが大事だと感じています。

とにかく、ここで述べたように、音楽生成AIの品質は本当にすごいです。私自身としてもこの分野がこれからどう発展していくのか楽しみです。今後も最新情報をチェックしていきたいと思っているので、随時その情報を共有していきます。

▼ 独立系ミュージシャンのためのメンバーシップ

#148 音楽生成AIの使い方概要と手軽さとすごさをお話しします

いいなと思ったら応援しよう！