AI和解派より。七瀬葵さんのAI解釈に問題があるので解説します
1451文字
まずはこちらの記事を読んでください。
突然の投稿にて失礼するわけだが、とある事情で炎上されているイラストレーター、漫画家の七瀬葵さん。AI技術に関する主張を拝読し、興味深く感じた次第である。しかしながら、一部に誤解が見受けられるように思うため、僭越ながら訂正および補足をさせていただきたい。
まず、「AIは画像を取り込んで画像を組み替える技術ではない」という主張についてであるが、確かに、「AIが1つの画像の中で直接組み替えを行っているわけではない」という点については正しいと言える。しかしながら、生成AI画像が多数の画像を学習し、それらのデータから抽出された特徴を統合・再構成するプロセスを踏むことを考慮すると、この表現は誤解を招く可能性がある。
「画像を組み替える」という言葉の解釈次第では、AIが多数の画像を相互に組み替え、新たな画像を生成している事実を過小評価される恐れがあるためである。
具体的には、生成AIは学習データセットから膨大な画像のパターンや特徴を抽象化し、これを統計的に再構成することで新しい画像を生成している。
この過程において、学習された特徴はあたかも複数の画像が「組み替えられている」かのように再利用される。したがって、「画像を取り込んで画像を組み替える」という主張が単に「1枚の画像を切り貼りする技術ではない」と理解されるだけでは、この技術の本質を見誤る可能性がある。
次に、「AIは一枚の絵を『可愛い、女の子、黄色い、ワンピース、りんご、持っている』のように解析している」という点についてであるが、これは部分的に正しいものの、AIの解析手法はより高度である。
AIは画像を単に要素ごとに分解するだけでなく、畳み込みニューラルネットワークなどを用いて画像全体の構造や関係性を数値的にモデル化している。これにより、ピクセル情報から多次元空間における特徴を捉え、より複雑な概念を学習しているのである。
つまり、人間が思考する以上の事を当然考えているわけだ。構造主義という考え方も学んで頂ければ幸いである。
また、「なぜ『言葉』で命令する必要があるのか」について、「学習元の絵を参照していないから」とする主張は完全に誤解である。
AIは、画像とテキストの対応関係を学習することで、プロンプト(言葉)に基づいて画像を生成する技術を獲得している。言葉で命令するのは、学習元を参照していないからではなく、言語がAIにとって効率的かつ柔軟な指示手段だからである。
最後に、「AIはすでに概念化したものを使って生成している」という点についてであるが、これは部分的には正しい。
しかし、AIにおける「概念化」は、人間の認知におけるそれとは異なり、学習データの統計的関係を抽象化したものである。
AIは学習データを直接参照しないものの、その生成物は学習データの特徴を強く反映するため、完全に影響を切り離すことはできない。
以上、AI技術に対する誤解を解消する一助となれば幸いである。AIという分野に対する関心を引き続き深められることを願ってやまない。