プロンプトすら考えるのが面倒になり、ChatGPTに全投げしてみた
みなさん、AI使ってますか?
私は毎日のようにChatGPTとStableDiffusionで遊んでいるのですが、最近は1からプロンプトを考えるのすら面倒になってきました。
ふと、そこでChatGPTに作ってもらえばよくね?と、思い立ちそれっぽいのが出来るようになってきたので記事にしてみました。
1.シーンの選択
どんな画像を作るか、人間側のざっくりしたニーズをChatGPTに投げます。
とりあえず、可愛い女の子を出しましょう。
今回はそれっぽさの出る部活中のイメージ。
この後の工程のために、「"○○部の××している瞬間"という形式で答えてください」と一言付け加えています。
2.文章をプロンプト化
つぎに今のシーンをプロンプト化します。
内容としてはこんな感じです。
さっそくStableDiffusionにぶちこみましょう。
なげえ…
いつもならa girl, sportwear, ・・・と長々と指示しているのでこんなに長い文章だと意味が分からなくなるのでは?と心配になります。
ここからはガチャタイム。無心で回し続けます。
私は日ごろt2t(良い構図探し)
→img2img(破綻していない絵探し)
→TileDiffusion(高画質化)
という流れです。
もしこんな良い方法あるよ!って教えてくれる優しい方、ぜひこっそり、いやコメントで教えてください。
こんな楽しいことはみんなで共有しましょう。
さて、出来上がりました。
おお、それっぽい!
ネットの位置とか、ボールどこだよとか気になってはいけません。
画像生成していて思うのは人間は「っぽさ」さえあれば脳内補完で良いものだと解釈しがちです。
横長の方が表現しやすいかな?と、思い横長バージョンも作りました。
なんかレシーブしてますね。
でも、後ろの子とも服装は近いしバレーしている感じは出ているのではないでしょうか。ちなみに今更ですがヘッダーもこのプロンプトから作っています。
まとめ
どうでしょうか。
個人的に面白いと思ったのはStableDiffusionサイドも長い文章から構図や要素を部分的に理解して出力しているところでした。
ちなみに出力された文章をChatGPTに指示してStableDiffusionへのプロンプト化をしてもらいましたが、まだまだ人力で書くプロンプトのようにはなりませんでした。
これからChatGPTがもっと賢くなったら出来そうですよね。自分で重み付けして、人間がどんな画像が好きかバシッと当ててくる。
そう遠くはない気がしますが、しばらくはこうやった使い方も模索していきたいですね。