![見出し画像](https://assets.st-note.com/production/uploads/images/115126181/rectangle_large_type_2_495fbf88b415ac61685ae44619619644.jpeg?width=1200)
Stable diffsuion 呪文
プロンプトとは?
AIに特定のタスクを実行させるための指示を伝える役割を果たす文章です。
AIでイラストを生成する時に文章で作りたい入力情報のこと。
これをプロンプト、日本語では呪文という。
プロンプトの順番
①品質:masterpiece, 8k, extremely detailed CG
②照明:brightening light, moody lighting, nature lighting, cinematic lighting
③部分: detailed face, detailed eyes, detailed skin
④作風: photo realistic, animation, illustration
⑤被写体:1 girl, cat, coca cola
⑥環境: school, home, sun
⑦構図:full shot, cowboy shot, profile
プロンプトは左側の先頭に来れば来るほど効果が大きいので
全体に影響するプロンプト①品質②照明③部分のところ、先に書きます。
例えば:
masterpiece, 8k, photorealistic, sunlight, detailed face,detailed eyes
品質を上げるプロンプト
2種類あります。
①画質だけ上げるためのプロンプト
best quality=最高品質の
top quality=トップクオリティの
ultra detailed=超詳細な
higher=高解像度の
high-resolution=高解像度の
HDR=高ダイナミックレンジの
4k=4K解像度
8k=8K解像度
unity 8k wallpaper=ユニティ 8kの壁紙
extremely detailed CG=極めて詳細なCG
②画質+芸術性
masterpiece= 傑作の
realistic= 現実的な
photorealistic= 写真のようにリアルな
2D= 二次元の
3D= 三次元の
beautiful detailed= 美しく詳細な
depth= 深み
fine-textured= 細かい質感の
monochrome= モノクロの
super fine : 光沢のある
perfectly focused= 完全にフォーカスされた
crisp= 鮮明な
refined= 精緻な
deep color= 深い色合いの
flawless= 完璧な
bright= 明るい
vibrant= 色彩が活き活きとした
depth= 深みのある
balanced= バランスが良い
smooth= スムーズな
super fine= 超細かい
vivid= 鮮やかな
bright= 明るい
vibrant= 色彩が活き活きとしていてエネルギッシュな感じ
①+②を併用するとより質の高い画像を作れます。
top quality, 8k, ultra detailed, masterpiece, beautiful detailed, bright,
![](https://assets.st-note.com/img/1691547361380-nGWa8zJSAS.png?width=1200)
人物のプロンプト
①人物:1 girl, 1 japanese girl, 20s, 30s, 1adult man, 1 boy
②顔の輪郭: slender face, round face, Inverted triangle face
③髪の長さ: very short hair, short hair, medium hair
④髪の形: straight hair, flipped hair(外はね), messy hair(癖毛),bob cuthair, half updo, hair bun, double bun, ponytail
⑤表情:smile, light smile, rape face, sleepy
⑥構図:face, upper body, pov, from below, upskirt, full body
⑦ポーズ:all fours(四つん這い), head tilt, selfie, finger to mouth, lying
強調プロンプト
強調:(1 japanese girl)
(〇) : 1.1倍 若しくは (〇:1.1)
((〇)):1.21倍 (〇:1.21)
(((〇))):1.5倍 (〇:1.5)
重複で強調することもできます。
同じ単語を2ついれると強調されます。
①〇、〇: すぐ後ろに並べる
②〇、▼、■、〇:別のところに入れる
例:
1 girl, sofa, sofa
1girl, sofa, pov, sun, sofa
※1.5倍以上は避けるようにしましょう。
ネガティブプロンプト
①品質:(worst qulaity:2), (low quality:2)
②作風:painting, sketches, (monochorome:1.5), (gray scale:1.5)
③奇形防止:missing fingers, skin spots,
④nsfw
毎回打つのがめんどくさい方は「EasyNegative」を使いましょう。「EasyNegative」の使い方は、顔崩れを防止するところに書いてあります。
注意点:
プロンプトが長すぎると認識してくれないことがあるので、2行から3行からおすすめです。
プロンプトが無視される時は、後ろに連続で入れること
サンプリングメソッド
サンプリングメソッドによって、生成される画像のスタイルが変わってくるので、色々試してみるのがおすすめですが、
多くの方はこの3つをよく利用されています。
DDIM:高速、高品質、ステップを上げることによって品質があがる。
DPM++2M Karras:早い シャープ 実写向き
DPM++SDE Karras:遅い 塗りキレイ イラスト向き
詳しく知りたい方はコッコ隊長の勉強部屋の記事を参考にしてください。
バッチカウント&バッチサイズ
一発で気に入る写真を見つけるのは難しいので
一気に複数の写真を出した方が効率いいですよね。
そういう時は、バッチカウントとバッチサイズを調整します。
入力したプロンプト対して生成される枚数を指定できます。
一度に4枚の写真を生成したい場合は
Batch count:4、Batch size:1
Batch count:1、Batch size:4
に設定するといいでしょう。
どれも同じですが、パソコンのスペックに自信がない方は
バッチサイズで画像生成したほうがより速く生成されます。
CFGスケール
1から30まで設定できますが、
30に近づくほどプロンプトを重視しますが、上げすぎるとよくないので
7が無難です。
画像生成が上手くいかない理由
①あるプロンプトがもつ要素の見極めがでてきない
AIは学習した画像とテキストを紐付けて行っている。
金髪のテキストに金髪の人の顔たちが紐付けている。
顔に関係ないようなプロンプトでも顔に影響するので
必要ないプロンプトは除くと上手くいくかもしれません。
②プロンプトを詰め込みすぎない。
AIはたくさん指示をすると混乱してしまうので詰め込みすぎない
何を重視するか?目の色を指定すると顔にフォーカスする。
③全身にすると顔が潰れてしまう。
・Hire.Fixで画質を上げると解決
・restore face で顔崩れを防ぐ(実写のみ)
・Easynegativeを使う
Hugging face に入って、easynegativeと検索します。
gsdf/EasyNegative/をクリックします。
![](https://assets.st-note.com/img/1691456694294-TqosxNyid2.png?width=1200)
![](https://assets.st-note.com/img/1691456613780-8Olf5KQj3Y.png?width=1200)
Files and version クリックして、EasyNegative.safetensorsをダウンロードします。ダウンロードしたファインるをembeddingsに入れます。
![](https://assets.st-note.com/img/1691456817433-OoEaBmLSny.png?width=1200)
EasyNegativeとHireFixを適応する前
![](https://assets.st-note.com/img/1691457075264-tZExS75LEU.png)
EasyNegativeとHireFixを適応した後
![](https://assets.st-note.com/img/1691457242824-0X9eLQPqI5.png?width=1200)
EasyNegative、HireFix、Restore Faceを適応した後
![](https://assets.st-note.com/img/1691458014822-5yTufr22Eo.png?width=1200)