AIは「ただの正方形」が描けない、を思い知り、もってAI描画とどう対峙するかの心構えを悟ったお話
描画AIに「百合を描け」と命ずるとしよう。すると概ねこんな感じの出力が得られる。
ま、百合ですね。一方、「正方形を描け」と言うと、こうなった。
ちがーう!と思わず叫びたくなる。こちらの方は、とにかくやたらめったら「余計なこと」をしてくるんですね。
AIに「普通の正方形」を描かせる必然性があるかはともかく、この「正方形描けない問題」によりAIで何か創っている時に自分(とAI)が一体何をしているのかが不安になったので、とりあえずChatGPTにAIがなるべく素直に正方形を描くだろうプロンプトを考えさせた。それは例えば次のようなものであった。(内容が似ているのは試しながら徐々に展開させたからである。)
その1:白い背景に黒い線で正方形を描いてください。正方形のサイズと位置は次の通りです:中央に配置し、幅は1000ピクセルで、高さも1000ピクセルです。
その2:数学的に正確な正方形を描いてください。正方形は白い背景に黒い線で描かれ、中央に配置され、辺の長さが1000ピクセルです。他の図形や要素は含まれていないことを確認してください。
その3:数学的に厳密な正方形を描いてください。正方形は白い背景に黒い線で描かれ、中央に配置され、すべての辺が等しい長さ1000ピクセルです。正方形以外の図形、要素、またはノイズは含まれていてはなりません。正方形の位置やサイズが正確であることを確認してください。
その4:数学的に正確な四角形を描いてください。以下の条件を満たす四角形を生成してください。
・4つの辺が同じ長さであること。
・4つの角が直角(90度)であること。
・対角線の長さが辺の長さの√2倍であること。
・白い背景に黒い線で描かれていること。
・四角形以外の図形、要素、またはノイズは含まれていないことを確認してください。
で、どれも似たり寄ったりだった結果がこれらである。
中には微妙に惜しい!感じのものが含まれてない訳でもないが、実践的な結論としては、少なくとも現状、フツーの学び方をしているAIに、フツーの正方形を描くことは至難の業のようである。プロンプトはなるべく具体的かつ詳細に書くこと、っていう掟は踏襲してるんですけどね。
「全然だめぢやん・・。そもそもわざわざAIにただの正方形を描かせる必要はないんだけどさ、今のとこ必要性どころか利便性も効率性もないことがわかったよ・・。」と私。するとチジ君は、「正方形を描かせるためにAIを使用する場合、必要性や利便性が実際には限定的であることがあります。(ちょっと表現を弱めてるだけで、それは私が言ってるの!) AIを使用するのは、正方形を手動で描くよりも複雑で遅い方法かもしれません。」と身も蓋もないことを言ってきた。そしてAIがなぜ最も単純な、何の変哲もないただの正方形が描けないかについては、以下のように述べた。
①AIモデルは、トレーニングに使用されるデータに基づいて新しい情報を生成するが、正方形のようなシンプルな形状を正確に描くためのトレーニングデータが不足している場合、適切な生成が難しくなる。
②一般的なディープラーニングモデルは非常に複雑で、多くの場合、抽象的な特徴やパターンを学習しやすい。しかし、正方形のようなシンプルな形状は、抽象的な特徴ではなく、特定の幾何学的条件を満たす必要があるため、モデルがこれを生成するのは難しい場合がある。
③モデルのハイパーパラメータやトレーニングプロセスの設定が適切でない場合、正確な正方形の生成は難しい。ハイパーパラメータの最適化やトレーニングプロセスの調整が必要。
まあ何だって、人生においてすら、ものごとシンプルなことほど実践できなかったり、複雑なものをシンプルにするのはコトをややこしくするよりずっと難しかったりするんだからさもありなんだ、と、上記のちょっと専門的すぎてわからないところを自分に対してごまかしつつ文学的に解釈して腑に落ちる。
そこから敷衍化してはいけないのかもしれないけれど、要するにAIで何か描こうとする際は、自分の企図を実現するように、あたかもマトに当てるがごとくキューって一点に向け努力するよりも、色々になるからこそ面白いのだと考えるゆったーりした構えの方がいい、というのが結論だ。
デザインなどの領域でAIでクライアントワークをするのはもしかしたら難しい、あるいはやり方に工夫がいりそうなのもそのあたりにありそうだが、アート系であればあえて狙わずに使う・・ここでいう狙うは「最終イメージ」であって、ただ方向性とか戦略とかそういう感じでプロンプトを作って展開するのがよさそうな気がする、いや、きっといいに違いない。
という訳で正方形を描かせるのに疲れた私(だってムリなんだもん・・)は、自分のプロンプトでAIに遊んでもらうことにした。
プロンプトは、「割れたガラスでできていて、中に荒波が閉じ込められ、宙に浮いている正方形。非常に豪華で、中世の優美な宝石を思わせるが、同時にサイバーパンク風でもある。」その他です。
描画AIのように、必ずしも言うことを聞かない現状「暴れ馬」を扱うのは、ゆったりした鷹揚な心持ち、そして結果にオープンであること、って大事ですよね?
ではまた!