tldrawに影響されて、なんとかこの性質を応用できないか考えたところ、言葉から概念図をまず作り、それに基づいて計画を立て、長いプログラム(128Kトークンを活用)を書かせるようなアプリを作りました。
GPT4でDALL-Eのプロンプトを書き、DALL-Eが概念図を描き、それをGPT-4Vが読み込んで開発計画を立て、GPT-4がゲーム本体を生成するという段取りです。
例えばブロック崩しだとまず以下のようなプロンプトが生成されます。
そこからDALL-E3で概念図が生成されました
この図をGPT-4Vで解釈して開発計画を立てます。
これをGPT4でロングコンテキストなプログラムにしていきます
Pythonを生成させようとするとインデントが消えることが多いので自動生成にはC++やJavaScriptのような言語が向いているのかもしれないと思いました。
tldrawが上手くいくのは、多分Webサイトというかなり限定された部品だからなのかもしれません。
試しにtldraw make realのプロンプトを参考にしてみます。
DALL-E3へのプロンプト
これに従って作られた概念図
これを受けて立てられた計画
この後色々やったが上手くいかなかった。
明日の朝大学の授業をやらないといけないので今日はこの辺で一旦寝る