音楽生成AI、MusicGenを使用してテキストと音声入力から音楽を生成してみた流れ
MusicGenというMetaによって開発された音楽生成AIモデルを使ってみました。
テキストと音声入力を使用して高品質な音楽を生成することができます。この記事では、MusicGenの使い方と機能について利用してみた感想を書いていきます。
1. MusicGenとは
MusicGenは、Transformerを利用した大規模なAIモデルで、ChatGPTなどの言語モデルと同様の技術を使用しています。MusicGenは、音楽の次のセクションを予測する仕組みで、2万時間分のライセンスされた音楽でトレーニングされています。
2. システム要件
MusicGenを実行するには、16GB以上のVRAMを搭載したグラフィックボードが必要とありますが、私はiPhone13ProでiPhone利用でも利用可能でさした。
3. 音楽の生成
a. テキスト入力:
MusicGenはテキスト入力に基づいて音楽を生成します。例えば、「128BPMで、キャッチーなシンセメロディ、グルーヴィーなベースライン、エネルギッシュなドラムを特徴とする、夏のパーティーテーマにぴったりなアップビートなエレクトロポップトラック。」というテキストを入力すると、それに合った音楽が生成されます。
生成された音源はこちら→
b. 音声入力:
音声入力もサポートされており、音声コマンドやメロディーを録音して、それに基づいて音楽を生成することができます。
4. 音楽の再生と保存
生成された音楽は、オンラインで再生したり、ローカルにダウンロードして保存したりすることができます。
5. デモと作例
MusicGenの[紹介ページ](https://gigazine.net/news/20230612-audiocraft-music-gen/)には、多数の作例が掲載されており、その品質を確認することができます。また、Hugging Faceのウェブサイトで実際にモデルを動かすデモが公開されています。
6. 注意点
音楽の品質はテキスト入力の仕方に依存します。適切なプロンプトを使用することで、高品質な音楽を生成することができます。あと生成するまでわりと時間がかかります。そして15秒程度と短めです。
まとめ
MusicGenは、AI技術を活用して簡単に高品質な音楽を生成することができるツールです。テキストや音声入力を使用して、思いついたアイデアを様々なジャンルの音楽に変換することができ便利だと思いました。使ってみた動画はYouTubeで公開してますので参考にしてみてください→