AI和解派の方が書かれた記事について解説します
おはようございます。榊正宗です。
👇まずは少し宣伝。AIでミュージックビデオを作りました!宜しければYouTubeでご覧ください!
さて、なんかAI和解派の方が書かれた記事について気になったので解説しますね。
こちらの記事で、七瀬葵先生がAIイラストに関するお話をされた際に、「AIは既存の絵を切り貼りしているわけではない」「学習元を参照していない」という表現をAIの解釈に問題があるとされていますがそんな事は無いと思いますよ。
七瀬葵先生の文に対して「いや、学習するときに参照しているんじゃないの?」と反射的に思ってしまう方もいるかもしれませんが、実はこれは“特定の画像をコピーしているのではない”という点を強調したいからこそ出た言い回しであって、必ずしも誤りとは言えないのではないでしょうか。七瀬先生を批判する人の中には「50億の絵が盗まれている」という極端な表現で「AIは既存の絵をそのまま使っている」と言わんばかりの声もあります。しかし実際の仕組みはそこまで単純ではありませんし、それこそが七瀬先生の言う「切り貼りではない」の真意だと思います。
AIがテキストの指示によって画像を生成する場合、重要な技術のひとつがCLIP(Contrastive Language-Image Pre-training)と呼ばれる仕組みです。これは、テキストと画像をセットで学習させて、「どの文章がどの画像と意味的に近いか」を大まかなベクトル空間で把握できるようにするものです。たとえば「黄色いワンピースを着た女の子」というテキストがあった場合、CLIPは膨大なデータから「この文章に似合うのはこういうタイプの画像だ」と判断し、それに近い方向性を示すベクトルを計算します。一方で、AIが生成しようとしている画像側もCLIPの画像エンコーダに通して、そのテキストとの近さを比較する仕組みになっています。Stable Diffusionのようなモデルは、これを何度も繰り返しながらノイズ混じりの画像を少しずつ修正し、最終的にテキストの内容に合致した絵を描き上げるわけです。
ここで重要なのは、AIが「○○先生のイラストをそっくりコピーして部分的に貼り合わせている」のではなく、「テキストと画像の対応関係から導かれた統計的な特徴」に基づいて新しい絵を再構成しているという点です。七瀬先生は「学習元を参照していない」とおっしゃっていますが、それは「個々の画像をそのまま引用してきて組み合わせているわけではない」という意味合いの表現と受け取れます。先生ご自身、長年描いてきた独特のタッチのイラストをAIが生成しようとしても、微妙に違うものに仕上がってしまう経験をされているのでしょう。だからこそ、「ああ、これは決して絵のコピーを引っ張ってきて貼り合わせているのではなく、あくまでも学習によって獲得した“概念的な情報”を使ってそれらしい絵を描き起こしているんだ」と実感されているのだと思います。
もちろん、LoRAのように少数の画像だけで特定作家の画風をより濃密に学習させれば、かなり忠実に似せることは可能です。けれどそれでも、すべてが一枚一枚のイラストのパーツをコピペしているわけではなく、「統計的に似せた結果」と呼べる仕組みであることに変わりはありません。ここを「参照していないなんて嘘だ」と声高に責める人もいますが、それは先生の言う「参照していない」のニュアンスを誤解しているように感じます。一般的にAIが参照していると言うと、「あの絵の右腕部分」とか「その絵の背景」を引っ張ってくるようなイメージを抱きがちですよね。そうした直感的な印象を払拭するために、先生は「AIがどこかから直接切り貼りしているわけではない」という言い方をされたのでしょう。
加えて、七瀬先生を批判する人々の中に「50億の絵が盗まれた」という言葉を使う方が多くいらっしゃるのですが、「学習」という過程を「盗み」と同一視するのも、さすがに言い過ぎではないかと思います。もちろん、学習データとして扱うことの倫理や著作権上の問題を指摘する声があるのは理解できますし、そこには議論の余地がたくさんあります。しかしながら「50億の絵をまるごと利用している」という表現からは「一枚一枚をそのまま使っている」というような連想を呼び起こしてしまうため、AIがどう動いているかを知らない人ほど「やはりAIは盗みなんだ!」と誤解してしまう可能性があります。実際には「無数の画像を見て、その傾向や特徴を統計的に抽出し、テキストと結びつける」仕組みであって、いわゆるコピーペーストやトレースとはまったく異なるプロセスなのです。七瀬先生が「それは盗みじゃないよ」と言いたいのも、そこに起因しているのではないでしょうか。
要するに、七瀬先生の主張をきちんと噛み砕いてみれば、「AIは特定の絵をそのまま流用しているわけではない」という当たり前の事柄をわかりやすく伝えているだけであって、「学習元のデータをまったく利用していない」などとは一言も言っていないのです。それを「参照していない=完全にゼロから生み出している」と曲解されてしまうと、「いや学習してるじゃん」と攻撃材料にされてしまいますが、先生の狙いは「コピペや切り貼りという誤解を解く」という方にあるのではないかと思います。ご自身の作品がAIによって“まったく同じ形”で再現されていない経験をされているからこそ、AIに対する正しいイメージを伝えようとした結果、ああした発言に至ったと考えるのが自然ではないでしょうか。
ネット上の炎上というのは、言葉尻だけを切り取って批判が膨れ上がりがちなものですが、七瀬先生の場合、決してAI技術の根本を誤解しているわけではなく、むしろLoRAなど含めて現状のAI技術がどのように働いているかに精通されている印象があります。あのシンプルな表現は、一般の方へ「AIって本当にただの盗みじゃないんですよ」と示すための言葉選びだったのだと思います。ここでCLIPの仕組みをはじめとする「テキストと画像を結びつける仕組み」を長々と解説しても、かえって難しく感じる人もいるでしょうから、七瀬先生の言葉が多少ざっくりしていても仕方ない部分はあるはずです。むしろ炎上している過程で、その事情を知らない人たちが「ほら間違ってるじゃないか」と騒いでしまい、一部の議論が加熱してしまったように見えます。
「50億の絵が盗まれた」という主張との対比でみれば、七瀬先生の言葉はむしろ冷静ですし、実は技術的にもほとんど間違いがないのではないかと感じています。学習=盗用とまで断じてしまうと、コンピュータサイエンスにおけるあらゆる機械学習やディープラーニングの手法が成り立たなくなってしまいますから、そこはやはり言葉の使い方を慎重にしないといけません。七瀬先生はその点をバッサリと「切り貼りじゃないんだ」と強調しつつ、「自分の絵をAIがそのままコピーしているわけではない」ことを、実感に基づき強調しているのだと思います。
七瀬先生の意図するところが「AIは画像の断片をそのまま使っているわけではない」という非常に素朴で正しい指摘にあるのがわかると思います。それを「参照していない」といった表現で簡潔にまとめたために、人によっては「すべてを参照していない」と受け取ってしまったかもしれません。けれど、「一般の人にわかりやすい言い方」を重視すれば、あれくらいのシンプルな説明になるのは仕方ない面もありますし、総合的に見れば先生がそこまで大きく勘違いされているとは思えません。いずれにせよ、AIの学習やLoRAをめぐる技術的な仕組みが今後さらに浸透していけば、「切り貼りではなく、統計的に抽象化された特徴を再構成している」という事実は多くの方に共有されるはずです。そうすれば先生があえて強調するまでもなく、「AIは画像盗用ではないよね」という理解が広がっていくのではないでしょうか。
とは言え、AIは完全に安全と言うわけではありません。
AIが言葉をもとに概念を抽出して絵を生成する仕組みは、一見すると「既存の絵をそのまま切り貼りしていないのだから問題ない」と思われがちです。実際、モデル内部は統計的に学習した特徴を組み合わせているため、特定の一枚の画像を完全にコピーしているわけではありません。しかし、それでも著作権や倫理面で懸念が生じる場合があります。たとえば、特定の作家の画風に非常に近いイラストが生成されることで、作家本人の権利や創作物との境界線が曖昧になるケースもありえます。さらに、テキストの指示によっては名誉毀損やプライバシー侵害につながる人物像が出力されてしまうこともあります。
たとえばLoRAやファインチューニングで特定ジャンルや作家のテイストを強化しすぎた場合、もともとモデルが備えていた汎用的なバランスを崩してしまい、その作家に似せた絵ばかり生成されるようになるかもしれません。あるいは、不適切なプロンプトを入力して過激な表現を出そうとする人もいないとは限りません。こうした出力結果が望まない形で世間に拡散した場合、「AIが自動で描いたから安全」という主張は通用しづらくなるでしょう。結局は、言葉によって抽象的に指示しているとしても、学習過程や出力の影響範囲を考慮したうえで、どのような絵が出てくるかに責任を持つ必要があるのです。特に商用利用や公的な場での利用を考える際は、著作権や倫理、プライバシーといった観点をあらためて確認しておくことが大切だと思います。
文化庁や政府の新たな方針では、規制よりもむしろAI技術の推進に重点を置いているようです。とはいえ、こうした問題については、モラルの範囲をきちんと守りながら利用することが大切だと思います。そして、あまりに悪質なケースが出てきた場合には、現行法で裁判を通じて判例を積み重ねていくしかないのではないでしょうか。