見出し画像

【生成系AI 研究活動#06】プロンプトの影響を検証(Stable Diffusion)


はじめに

AI画像生成する場合のプロンプトですが、もう使用する基本はだいたい固定化されているため、「プロンプトでどう変わるのか」いまいち認識しきれてないように感じていたので、シンプルなプロンプトから、いつものプロンプト生成の過程でどのくらい変化があるのか検証してみた。

単語での生成

どシンプルに単語のみ「えび」の英訳「shrimp」

よくわからないけれど、海老丼?が完成。
不思議とあいまいな指定だと丼物になる傾向があります。

ネガティブプロンプト追加

ネガティブプロンプトを入力する。

写真構図や色塗りにも艶が出てとても魅力的になりました!
(いろいろ気になる点はありますけどね!)

プロンプト追加

プロンプトの指示を増やしていきます「カウボーイショット」
カウボーイショットは、被写体の膝、または腿の半分くらいの位置から頭頂までを映し、その人物の自信とヒーロー的な雰囲気(人物が武器をかまえるなど、重要なアクションをしている時に)を表します。

あまり変化はみられませんね。
丼が画像内に収まるという変化でしょうかね?

「かすかな輝き,(ダイナミックポーズ:1.3)」を追加。

一気にイラストが変わりました。
「ダイナミックポーズ」ってなると、丼とは結び付かないですもんね。
いろいろ問題はありますがイラストとしては美麗ですね~さすがです。

そんな感じで、プロンプトの指定を増やしていきます。

出力結果

女の子かわいのに、海老要素がキショイ。
あとはガチャガチャです。
大量生産がきもです。(ここを何とかしたい!)
あまりに、期待できない場合にはプロンプトをいじる感じで作成してます。

「えび」要素を入れたいのに入れるとキモくて許容できないというジレンマから、最終的に完成は以下の2枚のイラストになりました!
「えび」要素はほぼ色味のみ!!という結果です!!
というのが最近のAI画像生成状況なので、ここから一歩前に進みたい!

もう、可愛ければ、それでよくない??(現実逃避)

さいごに

プロンプトはやはり重要だけれども、思ったようなアウトプットを得るのは今のやり方だとしいのを改めて実感。
プロンプトや手法、ツールを改めて見直していきたいです。

いいなと思ったら応援しよう!