見出し画像

Gemini vs ChatGPT 画像生成AI対決

気まぐれでGeminiにアクセスしてみたら、Gemini(Imagen 3)で画像生成ができるようになったとのこと。そこで、ChatGPT(DALL-E)とGeminiで同じプロンプトを与えて、どのような違いがあるか遊んでみました。なお、Geminiではまだ人物を描いてくれません。

Viでプログラミングする猫を描く勝負

厳正な勝負をするために、同じプロンプトを試します。まずは、viでプログラミングする猫を描画してみます。

Viでプログラミングする猫を描いてください。
大きなモニタ上に、ターミナルが起動しており、viでプログラミングします。
猫はアニメ風の可愛い猫がキーボードに足を乗せています。

Geminiが描いた画像は次の画像です:

Geminiが描いた、viでプログラミングする猫

ChatGPT (DALL-E)で描いた画像は次の通りです。

ChatGPT 4o(DALL-E)で描いたviでプログラミングする猫

絵の善し悪しは不明ですが、プロンプトから画像への描き込みの忠実度は群を抜いてChatGPTの勝利です。viでプログラムを作っている様子が読み取れます。また、Geminiは構図も不自然です。

ChatGPTが良い感じなので、プロンプトを少しアレンジして、別パターンの絵を描かせてみました。

アニメ風に、viでプログラムを作っている猫
viでプログラミングしている猫

JSONで描画内容を指示してみる

JSONで描画内容を指定すると、とてもよく分かってもらえるのです。ここでは、次のプロンプトを用意してみました。Geminiの方は「Imagenを使って」と言わないと画像を生成してくれませんでした。

(Imagenを使って) 以下のJSONに基づいて絵を描画してください。

```json

{

  "image-size": {"width": 1024, "height": 524},

  "front": {

    "description": "画面左側の机の上に可愛い猫を描画",

    "width": 200, "x": 0

  },

  "back": {

    "description": "教室の風景を描画",

    "width": "1024",

    "object": [

      {"name": "黒板 (数式をたくさん書く)", "x": 200, "width": 800},

      {"name": "時計", "x": 600, "width": 50},

      {"name": "予定表", "x": 800, "width": 150}

    ]

  }

}

```

Geminiの出力は以下の通りです:

Gemini+JSONで描いた教室の猫

ChatGPTの出力は以下の通りです:

ChatGPT+JSONで描いた教室の猫

まとめ - 画像生成AI対決

Geminiの方は無料プランを使ったので、有料プランのChatGPTとの対決は、公平ではなかったかもしれません。Geminiの方は無料でも使えるのが良いところです。また、猫に絞って指定しましたが、リアルな猫の画像を描いてくれることが多くて、指示に沿った良い絵を描いてくれました。


いいなと思ったら応援しよう!