こんばんは、アルです。
今回は少し趣向を変えて、DALL-Eを使って同じキャラクターを作れるのか?
というテーマを研究してみました。
もし小説を出版したり、サイトで掲載するときに色んなイメージ画像があった方が目を引きやすいのでは?と思ったのがきっかけです。
試したことのある方はわかると思うのですが、これめちゃくちゃ難しいんですよね・・・
結論を申し上げると、特徴を捉えている見た目がかなり近いキャラクターを生成することは可能でした。
サムネイルのような感じですね。
同じキャラクターを別の絵師さんが描いたような感じでしょうか。
たとえば自分のマスコットキャラクターを持っていて、特徴を捉えている別バージョンが欲しい方なども使えるんじゃないかと思います。
ということで今回は、こんな方に向けて書いています。
▶DALL-Eの使い方の幅を広げたい方
▶AI絵に興味がある方
使用したGPTs
まず、今回使用させていただくGPTsを紹介します。
ひろ吉さんが開発された「Simple Image Prompt Maker」です。
こちらが記事になります。
作りたい画像のコンセプトを伝えることで、その画像のプロンプトを作成してくれます。
※追記
ひろ吉さんが補足してくださいました。
これは私が今作ろうと思っているファンタジー小説に出てくる登場人物の設定の雛形です。
このプロンプトをGPTに英訳してもらい、以前も紹介させていただいた、
Super Describeに投げます。
出てきた画像がこちら。
GPTsが優秀すぎる
あ、かっこいい…。
もうこの時点で2つのGPTsがかなり優れていることがわかりますよね。
コンセプト通りにかっこいいキャラを作ってくれました。
しかしここからが難しい。今回は同じキャラクターを作るというのが課題です。
すると・・・
このように全く違うキャラが生成されます。
同じページで再度プロンプトを入力してみると、
このように別人が生まれます。ここまでの流れはAIの画像生成したことがある方なら経験されていますよね。GPTsは優秀ですが、DALL-Eの性能の方にまだ伸びしろがあるということですね。
同じキャラが生まれない。どうする
さてここからどうするかと悩みました。
色々試行錯誤しましたが、全くの同一の見た目を作るのは非常に困難でした。
しかし、思いました。
そもそも漫画やアニメのキャラだって、回ごとに見た目違うことあるんじゃないか?と。作者の画力が大きく上がり、連載開始時と終了時に大きく見た目が変わっているキャラっていますよね。烈火の炎とか。
しかし同一のキャラとして認識できます。
ではどうすれば同一のキャラだと認識されるのかと考え、仮説を立てました。部分的にしっかりこだわれば同一キャラだと認識されるのでは?と。
イメージとしては、免許証を見せたときに今の自分と同一人物だと認識されるかみたいな、そんな話です。
そこでどの部分をこだわるか考えました。私の現時点の答えとしては、
・顔の特徴
・背格好
・髪型と髪色
・服装(アウター・インナー・パンツ)
・その他アクセサリー等
これらを細かく指定することで、同一のキャラに見えやすくなります。
では実際に工程にいきます。
同一キャラクターを作ってみる
こちらが実際のやりとりですが、長いのでこの下にポイントを書き出しました。詳細にご覧になりたい方は引用から、ポイントだけご覧になりたい方はスクロールをお願いします。
ポイントまとめ
以下がポイントです。
・文章へのDALL-Eの解釈の幅を狭めるために数字(大きさ・長さ・個数など)を用いる
・瞳の色を必ず固定する
・髪は前髪・後ろ髪・横髪にわけて定義してもらう。色と質感も指定
・服はアウター・インナー・パンツ・その他(フードやマント)にわける
・アクセサリーは服と別で定義する
微調整
ここからは微調整に入ります。定義が曖昧な部分があるはずなのでそれを見つけます。文章の段階だとイメージしづらいですが、画像にするとわかります。
生成されたプロンプトを英訳してもらい、先ほどのテンプレートと一緒にSuper Describeに投げます。そして出来上がったのがこちら。
さきほどよりも近くなりましたが、同一キャラかというとなんか違いますね。ここまできたらこだわりたい。
髪色、髪の分け目、頭頂部の三つ編み、髪飾りの有無が主な理由でしょうか。
それぞれの定義を修正してもらい、再度生成してみます。
こちらがサムネイルでも使用しました、生成画像を並べたものです。だいたい7割くらいの確率で同じキャラと認識できる画像ができました。違う絵師さんが描いた同じキャラのように見えるんじゃないかなと思います。たぶん・・・
今回このキャラクターで難しいのは、
・三つ編みの位置及び有無
・花の髪飾りの位置や数
・後ろ髪の長さ
でした。プロンプトによってどこか統一しづらいか異なるようです。
なおDALL-Eには描写の際に優先されづらい情報があるそうで、今回で言うと花の髪飾りでした。
なのでプロンプトで忘れないように強調してもらっています。
あと、絵柄についてはどうしてもばらけるので、おそらく絵柄を指定できるGPTsがあれば解決できるかと思います。
このプロンプトをテキストデータだったりPDF化しておけばいつでも再利用できます。
いかがでしたでしょうか。少しでもAI創作の助けになれば嬉しいです。
以上、今回はこれで終わりです。
ご覧になっていただきありがとうございました!
繰り返しになりますが、今回はひろ吉さんが開発された「Simple Image Prompt Maker」を使わせていただきました。ありがとうございました!