
デフォルメプロンプト
画像生成AIを使用して、手書きイラストっぽいものを量産していきたい。
いわゆるひとつのmasterpieceも良いが、そればっかりが画像生成AIではありません。
たとえばそう、ウッーウッーウマウマぽい画像はどうやって出したらいいのだ。
と、思っていましたが、先日の記事で、期せずしてそんな手書き風イラストが出てきたので、今回はいろいろ試してみようかなと思います。
とにかく出てきたものは以下。


こんな具合のものが出ます。プロンプト等の条件は以下。
プロンプト
Gemini 2.0 has been released.
I basically like ChatGPT, but lately I've been liking Gemini.
There's no need to buy books when you're talking to Gemini.
Today again, we started a conversation with Gemini 2.0 with Japanese sake in hand, hoping to see what Gemini2.0 is capable of.
Basically, I always lose, but I'm leaving this article here to commemorate my victory in the argument with Gemini-chan.
ネガティブ
nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, quality bad, hands bad, eyes bad, face bad, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name
sampling Euler a
model Animagine XL V3.1
なのですが、似たような画風でいろんなシチュの画像を出したいですよね。
私は出したいです。
ChatGPTなどを使用した要素分解で[キャラ][背景][画風]などに切りわけるのがセオリーですが、そんな風なものはみられません。
おそらく[Gemini-chan]という文字がゆるい絵柄を誘発するんだろうと考えました。
シチュエーションはなんでもいいですが・・・
学校でスゴロク勝負を挑まれる。という感じでやってみます。
[キャラ:-999]
Gemini-chan.ChatGPT-chan,
[背景:-999]
school classroom,
[シチュエーション:-999]
You will be asked to compete in a Sugoroku match.

楽し気なものが割と出力されるが、

今回求めているものでもないんだよねえ。
アタマの文字を戻してみる。
[キャラ:-999]
Gemini 2.0 has been released,I basically like ChatGPT, but lately I've been liking Gemini.
Basically, I always lose, but I'm leaving this article here to commemorate my victory in the argument with Gemini-chan.
[背景:-999]
school classroom,
[シチュエーション:-999]
You will be asked to compete in a Sugoroku match.
こちらの方がまだマシで、いろんな絵柄のデフォルメキャラが出てくる。

しかし、線がいまいち。

元のプロンプトの方が断然良い。
ガチャガチャと出力していても何も進展しない。気もしてきたので、ウーウーウマウマちゃんたちを出してみましょう。
まず、日本語自然言語で、ウーウーウマウマ、ウマコちゃんを語ってみます。
[キャラ:-999]
ウマコちゃんは高校生の女の子、いつもニコニコ元気で、ダンスが大好き。
[服とポーズ:-999]
高校の制服でウサギのようなポーズでダンスをする。
[場所:-999]
体育館のステージ
これを英語プロンプトにしてみる。
[キャラ:-999]
Umako-chan is a high school girl who is always smiling and energetic and loves dancing.
[服とポーズ:-999]
She dances in a rabbit-like pose while wearing her high school uniform.
[場所:-999]
gymnasium stage

キャラ時点でgemini-chanを入れてみよう。
[キャラ:-999]
Gemini-chan,ChatGPT-chan,
is a high school girl who is always smiling and energetic and loves dancing.
[服とポーズ:-999]She dances in a rabbit-like pose while wearing her high school uniform.
[場所:-999]gymnasium stage



しかし使い物になるレベルではないような気もします・・・
品質を上げてみますか・・・
[キャラ:-999]
Gemini-chan,ChatGPT-chan,
is a high school girl who is always smiling and energetic and loves dancing.
[服とポーズ:-999]She dances in a rabbit-like pose while wearing her high school uniform.
[場所:-999]gymnasium stage
[品質:-999]
ultra detailed, final detailed,
cinematic lighting, soft focus,

品質を少し下げましょう。
[キャラ:-999]
Gemini-chan,ChatGPT-chan,
[服とポーズ:-999]
she is a high school girl who is always smiling and energetic and loves dancing.
She dances in a rabbit-like pose while wearing her high school uniform.
[場所:-999]
gymnasium stage,
[品質:-999]
ultra detailed,

うーん、判断できなくなってきた。
元の、偶然いい感じになったプロンプトを再度使用してみましょう。



うーんやっぱ少しこちらの方がまだマシ。
ChatGPTに要素を分解させる。
以下のようにプロンプトをキャラクター要素、背景要素、シチュエーション要素に分解しました。
キャラクター要素
Gemini 2.0
ChatGPT
Gemini
Gemini-chan
背景要素
日本酒
会話
記念
シチュエーション要素
リリース
話し合い
勝利を祝う
このように分けることで、それぞれの要素を明確に把握できます。他に何かお手伝いできることがあれば教えてください。
そうかあ。
[キャラ:-999]
Gemini 2.0,ChatGPT,Gemini,Gemini-chan,
[服とポーズ:-999]
release,discussion,celebrate victory,
[場所:-999]
Japanese sake,conversation,memorial,
[品質:-999]
ultra detailed, final detailed,

悪くない、といえるものも出てくる気もするのですが・・・
今度はnegativeプロンプトまで見直してみます。
プロンプト
[キャラ:-999]
Gemini 2.0,ChatGPT,Gemini,Gemini-chan,
[服とポーズ:-999]
release,discussion,celebrate victory,
[場所:-999]
Japanese sake,conversation,memorial,
[品質:-999]
ultra detailed, final detailed,
ネガティブ
nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, quality bad, hands bad, eyes bad, face bad, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,
long neck, deformed, mutated, mutation, ugly, disfigured, poorly drawn face, skin blemishes, skin spots, acne, the wrong limb, lowers, bad anatomy, bad hands, text, error, missing fingers, extra digit,Excess fingers, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,Black line,Excess hands, extra hands, jpeg artifacts,
sampling method Euler a
shcedule type Karras
sampling step 20
CFG Scale 6
size 1280*768


不思議と、安定して、線がクレヨンみたいになってくれて嬉しい。
では、服とポーズ、シチュエーションを変更して、いろんなものを出してみましょう。
プロンプトのみを変えます。
AIピクターズ様の「お題」を拝借して・・・
お題「キャンドル」
ChatGPTにアイデアをもらう。

[キャラ:-999]
Gemini 2.0,ChatGPT,Gemini,Gemini-chan,
[服とポーズ:-999]
White dress with a red stole wrapped around it.Holding a candle in one hand and combing her hair with the other.
[場所:-999]
In a dark room, candlelight reflects on the wall.
[品質:-999]
ultra detailed, final detailed,


うーんイラストに良い感じのバカっぽさが無くなった。
明るめのテーマにしましょう。
テーマ「ドッジボール大会」
[キャラ:-999]
Gemini 2.0,ChatGPT,Gemini,Gemini-chan,
[服とポーズ:-999]
play dodgeball,
Blue and white team uniform.
The moment you throw the ball, you put one foot in front of the other.
[場所:-999]
Inside the gymnasium, with spectators cheering,
[品質:-999]
ultra detailed, final detailed,


いろんな絵柄が出る、といえば、出る。




これじゃあただのanimagineだ・・・(2回目)
最初の状態に戻します。しかし、ネガティブワードは多め。
Gemini 2.0 has been released.I basically like ChatGPT, but lately I've been liking Gemini.There's no need to buy books when you're talking to Gemini.Today again, we started a conversation with Gemini 2.0 with Japanese sake in hand, hoping to see what Gemini2.0 is capable of.Basically, I always lose, but I'm leaving this article here to commemorate my victory in the argument with Gemini-chan.
ネガティブ
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, quality bad, hands bad, eyes bad, face bad, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,long neck, deformed, mutated, mutation, ugly, disfigured, poorly drawn face, skin blemishes, skin spots, acne, the wrong limb, lowers, bad anatomy, bad hands, text, error, missing fingers, extra digit,Excess fingers, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,Black line,Excess hands, extra hands, jpeg artifacts,
sampling method Euler a
shcedule type Karras
sampling step 20
CFG Scale 6
size 1280*768



しかし、良いともいいがたい。ただのanimagineです(3回目)
スゴロクバトルに再チャレンジ。


どちらも悪くはないですが、プロンプトは以下。
[キャラ:-999]
Gemini 2.0 has been released,I basically like ChatGPT, but lately I've been liking Gemini.Basically, I always lose, but I'm leaving this article here to commemorate my victory in the argument with Gemini-chan.
[背景:-999]school classroom,
[シチュエーション:-999]
You will be asked to compete in a Sugoroku match.
ネガティブ
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, quality bad, hands bad, eyes bad, face bad, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,long neck, deformed, mutated, mutation, ugly, disfigured, poorly drawn face, skin blemishes, skin spots, acne, the wrong limb, lowers, bad anatomy, bad hands, text, error, missing fingers, extra digit,Excess fingers, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,Black line,Excess hands, extra hands, jpeg artifacts,
sampling method Euler a
shcedule type Karras
sampling step 20
CFG Scale 6
size 1280*768

そろそろ、これ以上やっても無駄だなという気分になってきたので終わります。
お読みいただきありがとうございました。ネガティブプロンプトをたくさん書くことで、調整していくという方式も悪くないですね。それ以上の気づきは私には得られなかったですが、何かの参考になれば。
ではまた別の記事で。