見出し画像

音楽生成AIについて今後の想像と妄想と

ついに?やっと?もう? どう表現するのが適切かはわかりませんが、先日から盛り上がっています。 まぁ生成AIについてはずっと盛り上がっていますが、こう賛否それぞれの意見が流れてくると噛み合ってない気がするんですよね。言ってることが

現状の私の考えていることを出力します

予防線:個人の感想です


 まず、生成AIにの賛否については法律絡みで、それこそ国レベルでの判断が異なっています。そのため、この記事で書くことは私の理解した内容であり、想像でもあります。なので間違っていること、理解が浅いこと、過激になっていることが考えられます。
間違っているのであれば指摘がほしいし、議論がしたいのであればぜひという感じです。
ただ、専門家ではないのでその点も含めてご容赦いただければ。。。


生成AIのおさらい

 前提として生成AIとはなんぞやというところになります。以下を参考にします

生成AI(または生成系AI)とは、「Generative AI:ジェネレーティブAI」とも呼ばれ、さまざまなコンテンツを生成できるAIのことです。従来のAIが決められた行為の自動化が目的であるのに対し、生成AIはデータのパターンや関係を学習し、新しいコンテンツを生成することを目的としています。

https://www.nri.com/jp/knowledge/glossary/lst/sa/generative_ai

データやパターン関係を学習させることにより、それを元にしたものを新しく作っていく。という感じですね。
どういう原理なのかは理解できていませんが、以下の引用から考えると「抽出」だと思います

生成AIはプロンプトから解析し、予め学習している大量なデータの中から特徴を抽出し、適切な回答を導き出す仕組みになっています。この仕組みでは、大量データから特徴を自動的に発見できる人工技術の一種であるディープラーニングが用いられています。ディープラーニングは機械学習の手法で、学習しているデータを元にAI自身が最も適切な回答を導き出す手法です。

https://www.techfirm.co.jp/blog/generative-ai#2-1



雑に言えば、自分の理解したものからいい感じにまとめたものをポンと出す。って感じと捉えています

何ができるのか


 AIを使うことの利点は3つ
・作業の高速化:5分かからず1曲が作れますね。 やばいです
・65点の量産:現状では絵にしろ動画にしろ音楽にしろ100%の作品はないようです。必ず違和感なり異質な点が見つかりますが、人が作ったと考えても平均点以上の成績は残せそうなものが多いです。
・アイデアの提供:生成した答えには当人が考えつかなかった形ができることがあるので、それを参考にしたり、アレンジのベースにしたりするのに最適です
このようにAIは計り知れないメリット(あるいはブレークスルー)を提供しそうです。
なぜそのようなことができるのか。それは学習データの豊富さや質が影響してきそうです

学習データ


 AIの技術そのものについての賛否議論はほぼないと思っています。あるのは「学習データ」
上記の通り、AIは大量に取り入れたデータから、指示(プロンプト)に適したものを合わせるように答えを生み出します。 ではその学習データとはなにか
イラスト系AIで話題になりましたが、イラストAIの学習データ元はネット上にある画像を大量に読み込ませたものであるとのことです。これには正規のイラスト投稿サイトもあれば、どうも海賊版(違法アップロードサイト)も含まれているようです。
学習データにおける考えるべき点は
・違法なものを利用している可能性があること
・作成者の許諾を得ずに無断で使用している可能性があること
・その行為自体が違法ダウンロードにあたるのではないかということ
・学習元への経済的還元がないこと
このあたりを考えた上で、是非の検討が必要だと思います。

人との模倣との違い


 人の創作活動も、やってることは同じように見えます。学習データを模倣し自身の出した答えを生み出す。 抽象化した表現であれば同義のように見えますが、AIの出力は「抽出」です。
イメージとしては「模写した絵を書くのか、既存の絵を使ってコラージュするか」という認識です。
芸術的なコラージュの話では有りません。ファッション誌とか切り抜いて違うモデルと合わせて売るみたいな。認識通りであれば知的財産権、著作権、肖像権などの侵害に当たります

何が起こるのか


 生成AIによって何が起こるかを想像してみます

音楽制作の変化


 過去、音楽制作における転換期として「楽譜」「録音」「シンセサイザー」「ドラムマシーン」「サンプリング」「ボーカロイド」などの登場により、制作スタイルなどが大きく変わったと思われます。楽譜というかピアノかな?そこらへんはごめんなさい
特にドラムマシンの登場により、ドラマーの仕事がなくなる。というのはよく言われたらしいというのは聞いたことがありますね。実際の経緯をしらないのですが、現状もドラマーは貴重で重要な存在ではあります。
 あるいは複合作品を作る上でのBGMなどのたたき台として作曲者に言葉やイメージで話すのではなく、こういう感じの曲がほしいと、生成した曲を提示することとかも十分に考えられます。

インスタントミュージック


 自産自消の方向性になるかもしれません。 今は、BGMの希望をスマホに話しかければ、配信サービスから適切なプレイリストが選ばれて快適に音楽を聞けます。 AIにより希望を行ったその場で新しい曲が作られ毎日が新鮮な曲を聞けたりするかもしれません。 
言い換えれば音楽が更に身近になる可能性でしょうか

悪い方向で考えてみる


 即席で、そこそこの質のものを、大量に誰もが作れる
これが当たり前になった時、どのような悪影響があるのかを考えてみます。

悪貨が良貨を駆逐する


 ひっくるめてこれだと思うんですがすでに起きている問題として、先程例にも上げましたが、AI作成曲がストリーミング配信に流されているそうです

とりあえず再生数を稼ぎたいがためにそれっぽい曲を短く大量に作って、配信でバラマキ、プレイリストにまざりなんかよくわからないうちに再生されて小遣いを稼げる。という感じですね。

ちょっとくらいならと思っているといつの間にかプレイリスト全部がAI作になってたりするかもしれませんね。

悪貨である内はそういう形で表れて、本来聞きたいはずの曲や作りたいものが見つからずに本来作るべき人たちが日の目を見ないことに繋がるのではないか。ということを危惧しています。

脚切りの拡大と新規参入の低下?

 現状、AIの作品は65%の質だと書きました。これが70、80と上がっていけばどうなるか。
大作曲家、演奏家以外の人たちの出番が減るかもしれません。いや、学習データによって大作曲家の方が駆逐される可能性があります。 それを単価の安い駆け出しにリライトさせたりとかするかも。
つまり人の仕事を奪うのです
そして、「作曲をする」ということから「生成する」に変わると基本的なところ、下積み的なことは土台の部分を知らない人たちばかりになる?
あるいは作曲家という存在がバカバカしくなり目指す人がいなくなる? 
悲観論がすぎる気もしますが、AIによる創作人口が増えるイメージがまだ湧きませんね。

そして誰もいなくなった

 だれもが簡単に入手できることと、だれもが簡単に作れることとは意味が異なります。 昔は魚を3枚に下ろすことができなければだめだったので姑からよく怒られたと母から聞いたことがありますが、今は3枚におろされた魚を買えばいいだけです。 なので、3枚におろす技術は一部の人しか使えなくなりました
音楽にも同じことが言えるかもしれません。誰もが楽曲を簡単に手に入れることができるようになったことで、誰もが作曲を出来なくなった。
学習データの元となる既存曲が今後作られなくなったらどうなるのでしょうか。いずれAI曲を学習して音楽というものが全く異なるものに変わっていく可能性もあります。

裏音楽?

 ビートルズが先日未発表曲のデモ音源からボーカルを抜き出して新たに楽器隊を録音して新作として発表しました。これに生成AIは使われていないはず。。。
そこで思いついた一番使われてほしくないやり方ですけど、影響力の強いアーティストの幻の音源とか適当なことを言って偽のフェイク音源を作って売るとかあるでしょう。
現在、声の生成ですら可能になったので、そのアーティストだと思わせることが可能ではないか。未発表曲、海賊版音源、デモ版とか適当に謳っておいて、蓋を開ければただの生成曲でした。
全然あると思えるから嫌だなぁって


良い方向でも考えてみる

 正直なところ、芸術としての音楽の発展、ビジネスとしての貢献。と考えたときにあまり良い方向って浮かばなかったのですよね。。。ツールとしての利用くらいしか

だからこそ、3つのメリットを上手く使いこなすスーパーマンになれるかどうか。という話になるんですが



賛否両方書きたかったんですけど、こちらについてはあまり浮かばなかったのでやや中立的な視点で

結局変わらない

 現状だって、ループ素材そのまま使うとか下手すりゃ盗用だってあるからAIもそのカテゴリに入るのではというのも考えられます

65%のクオリティが変わらないとか本物にたどり着けない。という可能性もある

お手軽ツールとしての立ち位置に居続けるのだろうという視点

本物を知る

 逆説的に人がやることの価値があがるとは考えます。 人の温かみとかいう話ではなく、生成では到達しない要素。神は細部に宿るになるのか、そもそも人が生み出すことの良さが残るのか

アナログな録音によるノイズ残りやすいレコードよりもきれいに録音できるCDが出ましたが、レコードでしか残せないものがあると言われるように、アナログな創作でしか伝わらないものがあるかもしれない

現状と課題

 ここまで見ても分かる通り、私の立ち位置は「ツールとしては使いたいが使い方を誤ると色々面倒なので、静観」というふわっとした位置にいます。なのでメリットよりも課題やデメリットに目が行きます。

権利問題

 否定的な意見の集約は学習データにあります。その学習データをどう扱うのかが重要です。


文化庁の見解としては、学習データが研究目的か、商業目的かの判断に分けて検討しています

https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/bunkakai/68/pdf/93906201_09.pdf

JASRACは7月に権利を守るための声明を発表しています。

ハリウッドでは役者をモデリングして、顔や動きだけ取得して今後その役者を使わずに映画を作ろうとして大揉めしました。 制作側が折れて組合側の意見を取り入れて終結したようです。

イラスト業界は特に課題が山積みのようです

現在、各国AIの規制と利用の範囲の議論が非常になされています。基本的には規制を前提としていかに有効活用することができるのか。という方向性であるようです。なぜか日本はその逆をいっているようですが

利用時のリスク

 学習データをどう取得したかによりますが、既存サービスの殆どはウェブでオープンになっているものを取っていると考えられるので、基本的には無断利用のコラージュであると考えたほうが良い。

バレないだろうという考えもあるでしょうが、イラストに関して言えばプロンプト次第なのか学習元データをそのまま出力したケースもあります。つまりそのままコピーしていることになりかねない。

音楽の場合、それをどう判断できるのかはわかりません(現状、Sunoしか使えるものがないし使いこなしてもない)が、そういう危険性はあることは事実です。

Sunoの利用規約もやや気になるのが、有料プランで作成したものは商用利用OK。 無料プランで作成したものの所有権はサービス側にある。という点です。

所有権?(Ownership) 著作権(Copyright)じゃない? 著作権の所在については明記がなかったと記憶しています。ということはこれは芸術作品としての認識ではない? うーん。。。

いずれにせよ、AIによるマネタイズについては一歩間違えると危険が大きいといえます。

芸術・概念的なことに関する思考実験

 ここではちょっと思考実験というか答えがないかもしれないけど、こういう考えについてはどうだろうか。ということを上げていきます。

AI作品を芸術作品として捉えるべきか

 著作権と所有権の違いは芸術作品としての表現の無体物が対象なのが著作権であり、物質的なものを対象とするのが所有権ですが

学習データの問題もクリアした場合、それは芸術作品なのでしょうか。  過去の事例で言えばカメラの登場に近い? 

そういえばデトロイトっていうゲームでアンドロイドが作った曲がセールスランキングだかグランプリだかを取ってしまって、人間を守れ!みたいに怒っていたという話がありましたね。


何を持って芸術とするのかは偉い人に考えてもらいましょう

AIに真似されないものとは

イラストのときもよく言われましたね。AIで表現できないものを描けばいいと

その結果、AI絵っぽい絵を描く人やモデルがいわれなき非難を受けていますが、、、

音楽はイラストと異なり、聴覚、音というまた次元が若干違う話でもあるので一概には言えませんが、私には現状、AIが真似できないもの(学習データとして取り込めないもの)がなんなのかはわかりません。

出力に難があるとは思います。 ふわっとしたプロンプトならそれっぽくなるでしょう。細かすぎると難しいでしょう

ギターの弾き方や音の出し方だって、学習されればそのまま出力できるじゃないですか?

教えて専門家

どこに楽しみを見出すのか

 創作活動とは完成品ができるよりも完成させる過程が楽しいことはよくあります。音作りに何日も悩む。フレーズの練習、楽曲構成に悩んだり、歌詞の意味が伝わらないのではないか考えたり、、、

悩み手を動かすのが創作の楽しみです。 AIではそれができません。 

でも楽しいことはそれだけではないはず。 というかAIの強みというのはそういうのをすっ飛ばして完成品を楽しめることにあるはず。

言うならばプラモの完成品を買ってきた感じ? それを部屋で飾ることに喜びを見出す人もいるはずで、さらに言えば過程をすっ飛ばせるようにツールが進歩しているわけですから

現職クリエイターに響く言葉ですが、今後未来にこの言葉がどれほどの重みが伝わるのかはまだわからないです。なぜならAIによってクリエイター以外にも作品が作れてしまえるのだから

時代に合わせた著作権?

 学習データが課題ならOKにしてしまおう。そのために時代に即した著作権の考え方にするべきだ。という声が起きるのかな? もう起きてる? あ、日本はそういう方向でしたっけ?

新しい物が出た時、かならず規制したがる人がいます。と緩和したい人ならだれしも言いたい言葉です。 実際にMP3の登場によりデジタルコピーが非常に簡単に行われてしまうことを危惧してコピーガードCDとか有りましたね。あまりに不評でなくなりましたが

ではどのように学習データに利用されるアーティストたちにその利益を還元できるのか。これを考える必要があります。 規制緩和だけではタダ乗りですから

緩和して学習データOKにしよう!としたところでまたコピーガードの繰り返し、ひいては業界からの大々的なNOを突きつける可能性も考えられます。

さらに言えば世界の時流は規制方向です。 合わせるならそちらじゃない?

本物の価値や品質の底上げにつながるか?

 ツールとして使うにはこれほど便利なものは現状ないです。出力したものをそのまま使えば法的にはグレーです。 であれば、出力品をそのまま使わないで有効活用する方法を模索した際に、利用側のクオリティ向上が期待できると考えます

新しいアイデア、作業の効率化により、自分自身から生み出す作品は更にその上を目指す。という考え方

追いつけ追い越せです。

これにより全く新しい作品や歴史的な芸術が生まれてくる可能性は否定できません。

 また、昨今の消費方向としてもコレクションよりも体験型を重視する方向になっていることも注目します。 私は何枚CDを持っている。よりもあのライブに行った。生で聞いた。アーティスト話せた。という体験価値が重要です。 

そう思わせるための努力が必要になってくるのかもしれません。人類皆アーティスト?



おわりに

 色々調べたりまとめたりするのにやたら時間がかかりました。それでも答えはまとまりません。一個人でこれですから、国レベルで方向性の舵取りをするのに時間や検討はしっかり要すべきでしょう。

なるべく良い方向に行ってもらいたいです

繰り返しますが、ツールとして使えることと違法と犠牲の上で表現されているものであることは繋がっているというか表裏一体的なものですから、片方だけの意見を見て、もう片方の意見を無視するのは歪です。

それでもまぁ根本的な焦点は学習データの扱いでしょうから、ここは未来図もとかも考えながら進めてほしいと思います。

元記事:


いいなと思ったら応援しよう!