効果音生成AI「Audiogen」を使ってみた
効果音を生成できるAudiogenを使ってみました。
初めに言っておくと、がっかりする内容なので時間のある人だけ読んでください。OptimizerAIのほうが可能性があると思います。
OptimizerAIの感想はこちら↓
これを書いている人
YouTubeでローグライク関連の情報を発信しています。サウンドデザイン、フィールドレコーディングをやっています。仕事では音楽制作もやります。
使ってみた
最大10秒のモノラル音源を生成するというはほかのAIと変わらず。ただ、総合的なクオリティでだいぶ劣っているんじゃないかと感じました。
アンビエンスを作ろうとして失敗した例(プロンプト:森のアンビエンス、静かな夏の夕べ)
アンビエント音楽と誤解されたのかもしれません。
アドバンスド設定で何ができるかと言うと、ネガティブプロンプトの指定だけでした。細かい調整は苦手みたいです。
音楽も得意??
Audiogenは音楽も生成できます。1940年代ジャズ?
ジャズっぽいと言えばたしかにそう聴こえるが…?
値段相応?
Audiogenのサブスクリプションは月払いで5ドルです。音楽・効果音のサブスクって月20ドルくらいすると思うんですけど、そう考えると激安。
フリープランでも100回分で生成できて、ダウンロードも無料。
モノラルFLACファイルでダウンロードできました。サンプルレートは32kHz。さっき生成したJazz?の音源なら問題ないですが、もっとクリアで現代的な音を作るときには解像度の低さが気になります。
バリエーション
アップロードした音源のバリエーションを生成することもできるようです。自分で録音した包丁の音をつっこんでみました。
これ使い道ある?
感想
ゴミでした。
これから開発されていくのかもしれないですが、ほかにもっと良い生成AIはあります。効果音がやりたいのか音楽がやりたいのか、よくわからないのが一番だめなところだと思います。
音楽に関してはそれっぽいものを作れるんですけど、音楽をちょっとでも経験した人には「何かがおかしい」と感じるクオリティです。でも音楽まったく知らない人はこういうAI音源をばんばん使っていくんだと思います。
彼らのビジョンである「クリエイティビティの民主化」というのが、リテラシーの低下という形で実現されてしまうのだけはやめてもらいたいですね。