見出し画像

「AIイラストってなんでパッと見で分かるんだろう?」 ⇦ 原因を考えてみた。

 それはある日のことだった。

 Xをさまよっているとこのようなポストを発見した。



 確かに!

 思えばその通りだ。
 AIイラストは何故かパッと見るだけでAIのそれであると判ることが多いように思う。

 これは何故なのだろうか?

 せっかくだし考えてみた。
 疑問に思い、友人と議論を重ねていく中でそれらしい理由が個人的にいくつか見出だせたので、それを以下に示していく。

 つまるところ、AI絵をAI絵と判るのは、
  1.絵全体の情報量がアンバランス
  2.絵における各要素の整合性が取れていないこと
  3.感情的な情報の不足
という3点のためではないかというのが私の意見である。


1.絵全体の情報量がアンバランス

 これはAIで生成された、メイドさんのイラストである。

AI生成メイドさん

 背景から小物からメイドさんの衣服やら何やらから、なんなら窓の外まで詳細に描かれており、もう情報がギチギチである。
 絵全体の情報量が極めて多く、まるでミッケ!でも読んでいるかのような気分になることだろう。

 さらに、絵描きの方々なら判るだろう、情報量が多いだけでなく情報量のバランスもあまりよくないように思う。
 細部に対して過剰に描写を行う一方で、他の部分では不自然に省略されており、その結果として全体の情報量が計画されていないような疎らさになってしまっている。
 要素がフォーカスされていないのだ。

2.絵における各要素の整合性が取れていない

 以下はAI生成されたマフィアちゃんだ。

AI生成マフィアちゃん

 どういうシーンなのかが直感的に伝わってこないうえ、何かわからないような小物が散乱していたり、平面のような場所に奇妙な姿勢で座っているキャラクターなど、パッと見で違和感が飛び込んでくるこの感覚。こういった整合性の取れていないことに対してAI絵らしさを感じているのではないだろうか。

 というかパンツの半分だけが生足になっている。こういうキャラデザはあるかもしれないが、それはそれとして不可思議な点が多い。さらにケチを付けるならば、シワが多すぎるとも感じるだろう。
 トリックアートのような、一見正しそうだが、しかし違和感を感じるような感覚に似ている。

3.感情的な情報の不足

 以下は生成された軍人ちゃんである。

AI生成軍人ちゃん

 現実的で示しのない姿勢、微妙な表情、二次元のイラストでありながら、まるで現実のような表情や所作の淡白さがAIらしさを醸し出しているように思う。

 要はデフォルメ、誇張表現などにおいてどこか欠けるということだ。
 動きにハリがなく、こう、なんというか気持ちを感じない感じ。

 この妙な現実感と、イラストそれ自体が持つ二次元らしさのギャップが、独特のAIらしさを発生させているのではないかと考えた。

結論

 整理されていない情報量
 整合性の取れていない要素
 感情の感じられない淡白な雰囲気
この三つの要素に因り、AI絵はAI絵らしく感じられるのではないか、AI絵をAI絵と判るのはこれら3つの要素のためではないかというのがわたしの結論である。

 たまに手書き絵師の方々がAI生成の疑いをかけられるのは多分こういった要素のためだと思ったりもした。そこら辺の問題は複雑そうなので今回は述べない。

原因を考える.「LLM」に基づく生成AI達

 上記のように、AI絵がAI絵特有の不自然さを含有するのは、現在のイラスト生成AIが、イラスト内における、各要素の物理的な情報や、感情表現の指向性などを理解しないままに、LLM的な回答のみを出力するその性質のためなのではないかというのが個人的な考えだ。

 ちなみにLLMというのはラージ・ランゲージ・モデル(Large Language Model)の略で、日本語にすると「大規模言語モデル」となる。
 AIを作る方法の一つだと考えてくれればいい。

(「Amazon Web Service」より引用)
LLM としても知られる大規模言語モデルは、膨大な量のデータで事前トレーニングされた、非常に大規模な深層学習モデルです。

https://aws.amazon.com/jp/what-is/large-language-model/

 例えば、学習するために取り込んだデータがこれだったとして、

 この画像内の、服にかかる重力を重力と理解しないままに、また影を影と理解しないままに、「こういうものには大体こういう線があって、こういう色があるのが服」としてLLM使用AIは学習し出力する。

 つまり物理を理解しているのではなく、シワをただシワとして表現したりするので不整合が生じているのではないかということだ。

 物質や物理学、光学だのの科学的な本質を理解しないままに、不整合なイラストが、さぞ完成品のように生成されるためにAI特有のそれらしさが生まれている可能性を考えた。

 ※当記事はデータによる研究などに基づいて結論を裏付けするものではなく、あくまで個人による推測の域を出ないものである。

この記事が気に入ったらサポートをしてみませんか?