見出し画像

GPT APIだけでChatGPT Plusみたいに画像を生成させたい。

GPT API の「Image generation」で指定できるプロンプトは一つなんですよね。ChatGPT Plusでは、チャット上で画像生成を指示して、生成された画像に対して、追加のメッセージで調整ができる。
一つのプロンプトだと都度、生成指示を入力しなきゃいけないので面倒くさい。
なので、チャット機能+履歴を利用して、DALL-Eのプロンプトエンジニアという"役割"を与えて、指示メッセージからGPTを用いてDALL-Eの画像生成プロンプトを出力させることで、ChatGPT Plusのように振舞わせることができた。


1ターン目:大まかな画像生成指示を出す。

APIには生成後のレスポンス(revised_prompt)にDALL-Eがどういうプロンプトで実際の画像を生成したのかを取得できる。これを会話記録として保存し、次回以降の指示と組み合わせて、GPTに新しい画像生成指示を考えてもらうようにする。


2ターン目:キノコをチューリップにしてみた

1ターン目の指示を生かしつつ変えたい部分のキノコがしっかりチューリップに置き換わりました。


3ターン目:森にパソコンって。。。

森の妖精にパソコンって違和感しかなかったので、木製ベッドに変更指示をだしたところ、ちゃんとパソコンが木のベッドに変わりました。


この記事が気に入ったらサポートをしてみませんか?