
皆さんのAIは、鯉のぼりをちゃんと描いてくれますか?
ふと思い立ってChatGPTに鯉のぼりを描いてもらおうとしたけれどうまくいかなかった話をします。
今のAIは鯉のぼりの概念は知っているらしい
まずはChatGPTに尋ねてみました。

おお、よしよし! ちゃんと知っているようではないか。これならちゃんと鯉のぼりを描いてくれそうだ。

微妙……。
これはあれだな、こういう写真を取り込んで学習しているのだろう。
ニュースとかで出てくるのもだいたいこういうイベントの光景だもんね。
でも、一般的な鯉のぼりはこれじゃないよね。
鯉のぼりと言ったら、こっちでしょう。
なんとか、このように一般のご家庭で普通に見られる方の鯉のぼりを描かせたいと頑張ってみました。

ダメじゃん。
どうあっても鯉のぼりを縦向きに配置しようとしてくれます。強固な先入観に取りつかれているようです。
さらに粘ってみることにします。

うーむ。
まあ、さっきのよりはまだマシなような気はしますけどね。鯉自体はずっとまともに見えます。しかし、完全にポールから外れて自力で空を舞っているように見えるし、いずれにせよ、満点にはほど遠いでしょう。
仕方ない。もう一度チャンスをくれてやろうではありませんか。

はあ。Regenerateさせたら、すっかり元に戻ってしまいました。にもかかわらず「鯉は水平にはためいています」と自信たっぷりなのがイラつくんだよなあ。
オブジェクト同士の相対位置や向きの処理が苦手?
これは以前に別の画像を描かせてみた時にも感じたことですが、「縦のものを横向きにさせる」とか「正面から見ているものを横から描かせる」とか、そういう要望をChatGPT先生はぜんぜん受け付けてくれないですね。
また、「Aの後ろにBが配置されているけど、BをAの前に持ってきてちょうだい」みたいなのも碌に対応してくれません。
個々のオブジェクトの単位でみると、ChatGPT(DALLE-3)の画像生成機能は日に日に完成度が上がっているように見えます(指が6本ある人間もまず描かなくなった)。しかし、複数のオブジェクトの配置となるとまだまだですね。そして、視点の調整もダメで、この辺はだいぶん出たとこ勝負です。
これを解決できるうまいプロンプトの書き方があったりするんでしょうか? あるいは、他のAIだと賢く対応してくれる?
情報をお持ちの方はコメントなど戴ければ幸いです。