ChatGPTの画像生成AIであるDALL-Eは、ユーザーの入力したプロンプトでそのまま画像生成するのではなく、ユーザーのプロンプトからChatGPTがより詳しい画像生成用のプロンプトを作成し、そのプロンプトで画像生成をしています。
この仕組みを利用して、簡単なプロンプトから詳細で効果的なプロンプトを作成することができます。
その場合、ChatGPT(DALL-E)は、画像生成プロンプト作成器のような働きをすることになります。
1.DALL-Eで描いた画像のプロンプトを見る方法
(1) 公式GPTsのDALL-E
ChatGPTで画像を生成する場合は、公式GPTsのDALL-Eを使用すると、一度に2枚の画像を生成してくれるので便利です。
(2) PC用ウェブサイトでの操作
このGPTsで「浅草で三色だんごを食べているアニメ少女」と入力すると、以下のような2枚の画像が生成されました。
画像をクリックすると、その画像が拡大表示されます。
次に、右上のⓘをクリックすると、ChatGPTが作成し、画像生成に使用された英語のプロンプトが以下のように表示されます。
なお、どちらの画像を選んでも、プロンプトは同じです。
また、ここで「コピーする」をクリックすると、英語のプロンプトがコピーされます。
この画像のプロンプトは以下のとおりです。
最初に入力した「浅草で三色だんごを食べているアニメ少女」という簡単なプロンプトから上記のような具体的で詳細なプロンプトがChatGPTによって作成されました。
(3) スマホアプリでの操作
ChatGPTのスマホアプリでDALL-Eが生成した画像のプロンプトを見る方法は以下のとおりです。
最初に画像をタップして拡大し、右上の三点リーダーをタップすると、以下の左図のようにメニューが表示されます。
次に、「プロンプトを表示する ⓘ」をタップすると、右図のように英語のプロンプトが表示されます。
また、ここで「コピーする」をタップすると、英語のプロンプトがコピーされます。
2.簡単なプロンプトから詳細な画像生成プロンプトを作成
(1) 画像生成プロンプトの作成
「着物を着たアニメ少女」と入力して、DALL-Eで画像を生成しました。
ChatGPTが作成したこれらの画像のプロンプトは以下のとおりです。
(2) 画像生成プロンプトの使用例
① DALL-Eで使用
上記の英語プロンプトをコピーしてDALL-Eに入力し、再度、画像生成を行いました。
② FLUX.1で使用
Grokに上記の英語プロンプトを入力して、FLUX.1で画像生成しました。
少し実写風の画像になりました。
③ ImageFXで使用
GoogleのAI Test KitchenのImageFXで上記の英語プロンプトを使用して画像生成しました。
ImageFXでは、オレンジ色でマーキングされた部分の単語を他の選択肢に変更して、画像を様々にアレンジすることができます。
右上の画像の拡大図
④ Recraft V3で使用
Recraft V3で上記の英語プロンプトを使用して画像生成しました。
画像の拡大
3.好みの画像から画像生成プロンプトを作成
(1) 画像生成プロンプトの作成
フェルメールの代表作である「真珠の耳飾りの少女」の画像を使って、画像生成プロンプトを作成してみました。
最初に、ChatGPT(GPT-4oモデル)の入力欄に画像を貼り付けて「再現して」と入力します。
すると、以下のように元の画像をできる限り再現した画像が生成されます。
次に、生成された画像をクリックして拡大表示し、右上のⓘマークをクリックして英語プロンプトを表示させます。
ChatGPTが作成した画像のプロンプトは以下のとおりです。
(2) 画像生成プロンプトの使用例
① DALL-Eで使用
上記の英語プロンプトを少しアレンジして、少女を日本人に変更した画像をDALL-Eに生成してもらいました。プロンプトの最後に「日本人女性」と追加しています。
右側の画像の拡大図
この画像のプロンプトは以下のとおりです。
内容はあまり変わりませんが、「featuring a Japanese woman」が追加されています。
② FLUX.1で使用
Grokに上記の日本人化した英語プロンプトを入力して、FLUX.1で画像生成しました。
あまり日本人の顔立ちにはなりませんでした。
③ ImageFXで使用
GoogleのAI Test KitchenのImageFXで上記の日本人化した英語プロンプトを使用して画像生成しました。
DALL-Eの画像ほど日本人らしくはないようです。
右下の画像の拡大図
④ Recraft V3で使用
Recraft V3で上記の日本人化した英語プロンプトを使用して画像生成しました。
日本人らしい顔立ちになりましたが、少し画像が粗いように感じます。
画像の拡大
4.写真から画像生成プロンプトを作成
(1) 画像生成プロンプトの作成
題材としてとても良いので、チャエンさんがXに投稿していた写真画像をお借りします。東京タワーと増上寺、そして遠くに富士山が写っています。
最初に、ChatGPT(GPT-4oモデル)の入力欄にこの画像を貼り付けて「再現して」と入力します。
すると、以下のように元の画像をできるだけ再現しようとした画像が生成されます。
次に、生成された画像をクリックして拡大表示し、右上のⓘマークをクリックして英語プロンプトを表示させます。
富士山が近すぎるのと、建物がミニチュアモデルっぽい感じがします。
ChatGPTが作成した画像のプロンプトは以下のとおりです。
(2) 画像生成プロンプトの使用例
① DALL-Eで使用
上記の英語プロンプトをコピーしてDALL-Eに入力し、再度、画像生成を行いました。
左側の画像の拡大図
増上寺が巨大化しています。
② FLUX.1で使用
Grokに上記の英語プロンプトを入力して、FLUX.1で画像生成しました。
DALL-Eのようなミニチュアモデル感がなく、より実物の写真ぽいですが、増上寺が三重塔になってしまいました。
③ ImageFXで使用
GoogleのAI Test KitchenのImageFXで上記の英語プロンプトを使用して画像生成しました。
左上の画像の拡大図
より写真ぽくなったように感じます
④ Recraft V3で使用
Recraft V3で上記の英語プロンプトを使用して画像生成しました。
画像の拡大
写真ぽくなっていますが、東京タワーと増上寺が大きすぎます。