Gemini vs ChatGPT 画像生成AI対決
気まぐれでGeminiにアクセスしてみたら、Gemini(Imagen 3)で画像生成ができるようになったとのこと。そこで、ChatGPT(DALL-E)とGeminiで同じプロンプトを与えて、どのような違いがあるか遊んでみました。なお、Geminiではまだ人物を描いてくれません。
Viでプログラミングする猫を描く勝負
厳正な勝負をするために、同じプロンプトを試します。まずは、viでプログラミングする猫を描画してみます。
Viでプログラミングする猫を描いてください。
大きなモニタ上に、ターミナルが起動しており、viでプログラミングします。
猫はアニメ風の可愛い猫がキーボードに足を乗せています。
Geminiが描いた画像は次の画像です:
ChatGPT (DALL-E)で描いた画像は次の通りです。
絵の善し悪しは不明ですが、プロンプトから画像への描き込みの忠実度は群を抜いてChatGPTの勝利です。viでプログラムを作っている様子が読み取れます。また、Geminiは構図も不自然です。
ChatGPTが良い感じなので、プロンプトを少しアレンジして、別パターンの絵を描かせてみました。
JSONで描画内容を指示してみる
JSONで描画内容を指定すると、とてもよく分かってもらえるのです。ここでは、次のプロンプトを用意してみました。Geminiの方は「Imagenを使って」と言わないと画像を生成してくれませんでした。
(Imagenを使って) 以下のJSONに基づいて絵を描画してください。
```json
{
"image-size": {"width": 1024, "height": 524},
"front": {
"description": "画面左側の机の上に可愛い猫を描画",
"width": 200, "x": 0
},
"back": {
"description": "教室の風景を描画",
"width": "1024",
"object": [
{"name": "黒板 (数式をたくさん書く)", "x": 200, "width": 800},
{"name": "時計", "x": 600, "width": 50},
{"name": "予定表", "x": 800, "width": 150}
]
}
}
```
Geminiの出力は以下の通りです:
ChatGPTの出力は以下の通りです:
まとめ - 画像生成AI対決
Geminiの方は無料プランを使ったので、有料プランのChatGPTとの対決は、公平ではなかったかもしれません。Geminiの方は無料でも使えるのが良いところです。また、猫に絞って指定しましたが、リアルな猫の画像を描いてくれることが多くて、指示に沿った良い絵を描いてくれました。