こんにちは!RUNO.です。
本日も昨日に引き続いて、Stable Diffusionでの画像生成に挑戦です!
見どころは、
「参考画像を渡すことができずテキストでの命令しかできないとき、
いかにして意図したキャラクターに近い画像を生成するか?」
です!参考にしてみてください!
生成方法
昨日の環境と同じものを使用しています。詳細はこちら↓
今回のテーマ背景
今回は、上の昨日の記事でも紹介した、AICU主催の「AICU Summer Art Contest 2024」の3部門のうち、(1)キャラクター部門 に応募しようと思います。
そして、今回わたしはこの「ちびデルタ」ちゃんをモチーフに画像生成をしよう!と考えました。
そこで本題です。
キャラクターモチーフの画像を生成するとき、わたしはこれまで、既存の画像を参考画像(AIに渡す知識)として渡すことが多かったです。
ですが、今回利用させていただく環境のGoogle Colab Notebookには、この環境だけでは「参考画像をアップロードする」ということができないみたいです(見落としていたら大変申し訳ございません!!)。
そこで、
テキストプロンプトのみでちびデルタちゃんだとわかる画像を生成することに挑戦してみよう!
というのが、今回のテーマです。
手順
まず、参考画像を添付した上でChatGPTにプロンプトを作ってもらう
ChatGPTに投げたプロンプト
ChatGPTの出力
次に、得られたテキストをStable Image Ultraのプロンプトに入力
得られた画像がこちら!
だいぶちびデルタちゃんの容姿に近いのでは!?!?
2回目の挑戦!
少しプロンプトを変えます。
ChatGPTにプロンプト修正依頼をかける
修正依頼のプロンプト
ChatGPTの出力
Stable Image SD3 Ultraで再度画像を生成する
かわいい!!!!そして鮮やか&華やかになりました!!!!
3度目の正直
プロンプトを再調整します。
「キャラクター花火を知らない人でもわかるように、キャラクター花火について説明して」とChatGPTに聞き、その説明文をプロンプトに含みました。
「知らない人でもわかるように説明して」と頼むのがポイントです。
こうすることで、参考画像が渡せなくともよりイメージに近い画像生成を実現できます。
修正版のポジティブプロンプトがこちら↓
(細かいですが、髪色の黄緑の英訳が「light green hair」となっていたところを「light yellow green hair」に変更してあります)
さて、どうでしょうか!?!?!
4度目の正直
キャラクター花火の説明を自分で考えて書き換えてみました。
確かに鮮やかでエモーショナル!!!
5度目の正直
もう一度、ChatGPTにリライトさせてみた。
ChatGPTへのプロンプト
ChatGPTの出力
・・・これ、もしかして、前の生成結果引き継いでる・・・???(無知)
リロードして初期化し、6度目の挑戦
同じプロンプトでチャレンジ。
リロードは関係なかったかも( ; ; )
気に入ったイラストを応募してみたよ!
おわりに
本筋の「画像を伝えずにキャラクターの特徴を言語化し、テキストプロンプトのみで画像生成をする」というところはうまく行きました。
ちびデルタちゃんモチーフのキャラクター花火(ドット絵で描かれた花火)というのが難易度高かったようです。
今日も楽しかったです!
最後までお読みいただき、ありがとうございました!!!