見出し画像

プロンプトの「足し算・引き算」で理想の画像を作る!画像生成AIの極意

✅「プロンプトの書き方ひとつで、AI画像の完成度が劇的に変わる」って知っていましたか?

画像が思い通りにならない原因は「AIの性能」ではなく、「プロンプトの調整不足」かもしれません。
今回は画像の"矛盾"をなくす、プロンプトの「足し算・引き算」のとっておきのテクニックを紹介します!

画像生成エンジンは、ChatGPTなどから利用できるDALL・E3を用いて説明しておりますが、他の画像生成AIにも活用いただける内容だと思います。


はじめに

画像生成をするためのプロンプトを書く際には、要素の「足し算」を意識して書く方が多いと思います。
ですが足し算を続けていくうちに、1枚の画像の中で"矛盾"が起きてしまうことが多々あります。

たとえば人物画像を生成する時に…

  • ピースサインを出している

  • サムズアップをしている

  • 開いた手を差し出している

  • 両手を合わせてハートサインを出し…

って、その人は千手観音か何かですか!?(ツッコミ)
となりますよね?

つまりその"矛盾"を取り去るために、時には「引き算」をすることも大切なのです。

【実例】ベルヌイさんで学ぶ「足し算・引き算」

うちの子(ベルヌイさん)を例に考えてみましょう。

「足し算」をして全身を描く

この画像のベルヌイさんを構成する要素は次のようなものが挙げられます。

  • 茶髪

  • ポニーテール

  • 緑の瞳

  • 緑のパーカー

  • チェック柄の赤いスカート

  • スニーカー

要素を足し算してプロンプトを並べたのですが、これらはすべて矛盾せずに、1枚の画像の中に収まっていますよね。

このベルヌイさんの上半身のアップを描きたい場合はどうしたら良いでしょうか?

「引き算」をしてみる

この画像で注目していただきたいのは、「上半身のアップ」の構図だということです。

先ほどの画像と比較して、何かを引き算しています。

そうです。
「スニーカー」の要素は、上半身のアップには必要ないですよね。

さらに引き算してみましょう。

さらに「引き算」をしてみる

今回は、何を引き算したでしょうか。
もうお分かりですね?

「チェック柄の赤いスカート」を引き算することで、よりベルヌイさんに迫った構図になりました。

つまり、

✅画像の中に必要ない要素は、プロンプトに入れない

というのが大事なのです。

それは、構図以外にも共通して言えることです。

この画像で注目していただきたいのは表情です。
表情に関係する、次の要素が含まれています。

  • 閉じた目

  • 大きく開いた口

  • 満面の笑み

先ほどまでと大きく違うのはどこでしょう。

正解は「緑の瞳」です!

「閉じた目」という要素があるので、瞳の色は分からないはずですよね。

想像力を働かせるのも大切です。

これが正解!AIが理解しやすい足し算

では、正しい足し算の仕方とはどのようなものでしょうか。

"矛盾"しないこと

次の画像はベルヌイさんを「FF14風」に生成したものです。

初めにご紹介したベルヌイさんの要素を使用しています。
こちらも1枚の画像の中に、要素がしっかり収まっていますよね。(ちょっとチョコボの形が怪しいですが)

この画像には次のような要素が加えられています。

  • FF14風

  • ララフェル

  • 平原

  • 疾走するチョコボ

  • 曇り空

"矛盾"が起きないように、プロンプトを足し算しました。

もし、これに「ミコッテ」という要素が加わったら、"矛盾"が起きてしまいますよね。ララフェルとは種族が違いますから。

✅生成された画像の違和感に気付いたら、要素を引き算してプロンプトを調整しましょう。

想像力を働かせ、足し算する

次はこちらの、雪合戦をするベルヌイさんをご覧ください。

ベルヌイさんの立場になった気持ちで、想像してみてください。

もこもこのイヤーマフを着けていますね。温かそうですね。
ですが、もし「ニット帽」を被るとしたらどうでしょう?

ポニーテールに結った髪の上からニット帽を被るのは、ちょっと無理があると思いませんか?

そうです。"矛盾"が生じてしまいます。
そういったプロンプトの場合は、思い通りになっているとは言えません。

✅想像力を働かせながら、"矛盾"しないように足し算する

これがプロンプトを書く上で大切だと思います。

ちなみに、「ニットのセーター」と「ダウンジャケット」は足し算できます。
重ね着するだけですからね!

風景画像でも「足し算・引き算」が重要!

ここまで人物画像の場合を説明しましたが、風景画像に関しても同様のことが言えます。

この画像に含まれている要素は

  • 田舎の風景

  • キャベツ畑

  • 日本の古民家

  • 遠景に見える、雪を被った日本の山々

という具合です。
それぞれが"矛盾"せずに足し算できていますよね。

まとめ

✅AI画像のクオリティを上げる3つのポイント

  1. 要素の「足し算」で構成を明確にする

  2. 不要な要素を「引き算」して矛盾をなくす

  3. 想像力を働かせて、リアルなプロンプトを作る

今回も最後までご覧いただき、ありがとうございました!

いいなと思ったら応援しよう!

ベルヌイ/緑のタヌキ
よろしければサポートお願いします!何か記事へのリクエストなどがあれば一緒にいただけると嬉しいです。