Stable Diffusion | 自分用プロンプトまとめ
AI画像生成に欠かせない、プロンプトについてまとめていきます。
勉強したことの自分用まとめnoteです。
プロンプト(呪文)とは
プロンプトとは、こちら側の要望です。描いてほしい絵の注文内容をプロンプトといいます。
プロンプトを細かく指定すれば、より想い通りの画像が仕上がります。例えば、スタバの注文で「コーヒーください」より「ソイラテ、アイス、氷少なめで」と伝えた方が好みのコーヒーが手に入ります。AI画像生成のプロンプト同じです。
AI画像生成で、プロンプトが要なことがわかります。
AIに欲しい画像を伝えるときに、プロンプトの書き方のルールがあります。独自のルールに従えば、魔法のように画像ができることから呪文(プロンプト)と呼ばれることもあります。
プロンプトの組み立てかた
書き方のルールとコツ
英単語で書く(「a」「the」などの冠詞は省略)
カンマ(,)+半角スペース で区切ってつなげる 例: girl, medium heir, almond eyes
優先度が高い順に並べる
単語(トークン)数は原則75トークン
1.英単語で書く
英語が苦手でも大丈夫。翻訳ツールやChatGPTを使えば簡単です。
2.カンマ(,)+半角スペース で区切ってつなげる
単語同士をカンマ(,)+半角スペースで連結すればプロンプト完成です。
3.優先度が高い順に並べる
さいしょの単語が優先され、後ろの単語ほど無視されやすいと言われています。
4.単語(トークン)数は原則75トークン
75文字以上を続けて羅列すると、誤認識を起こし生成に悪影響が出ます。その場合、75トークンごとに改行し、次の行の先頭に「BREAK, 」と入力しさらに改行して続きを書きます。※「,」も1単語でカウント
プロンプトのヒント
これらの要素を加えると、より質の高い画像生成ができます。
※全て入れる必要はありません
プロンプトに入れる7要素
品質
コアプロンプト
追加要素
背景
アートスタイル
構図
照明やフィルタ
1.品質
best quality (最高品質)、masterpiece (傑作)、ultra detailed (細部まで表現)、insanely detailed (最高傑作)など
品質ワードは、画像全体の品質を決定するプロンプトです。これを加えるとクオリティが上がりやすいです。
2.コアプロンプト
a girl (1人の女の子)、beautiful background illustration (美しい風景画)、a dog(1匹の犬)、cool guy (イケメン)など
コアプロンプト=描いて欲しいものです。何を書いて欲しいのか?主役を表すプロンプトです。
3.追加要素
looking at viewer (カメラ目線)、bangs (前髪)、smile (笑顔)、school costume (学生服)、long face (面長)など
追加要素は、コアプロンプトを補足する単語です。主役が人物なら、髪型や服装、表情など。主役が風景画像なら、そこに映る建物の特徴、小道具、動物など。
4.背景
no background (背景なし)、in cafe (カフェ)、spring scenery (春の景色)、on the bed (ベッドの上)など
背景は、そのまま画像の背景や主人公のいる場所のプロンプトです。
5.アートスタイル
3D render (3D CG )、Pablo Picasso style (ピカソのような)、illustration (イラスト)、cel anime (アニメ風)など
アートスタイルは画風を決めるプロンプトです。画像の雰囲気が大きく変わるプロンプトです。
6.構図
Full shot (全体像)、Close-up shot (顔のアップ)、POV (撮影者の視点から)、Low angle shot (低視点から)など
構図は、カメラと被写体の距離を指定したり、カメラアングルなどのプロンプトです。
7.照明やフィルタ
cinema lighting(映画のような)、low contrast (明暗の差が少ない)、Shallow depth of field (被写体の一部にピント)など
照明やフィルタは、携帯の画像加工のようなプロンプトです。
ガチャと言われる理由
どんな画像になるかはプロンプト次第です。
その上で、AIがどんな画像を生成するかは運しだいな一面があります。
まるで、ガチャぽんを回し、何が出てくるかお楽しみ的な感じです。
自分好みの画像が生成されるまで、ガチャを回し続けたり、コアプロンプトに要素を足したり引いたり。案外、地味な作業です。トライ&エラーを繰り返しながら理想の画像が出てくるのを待ちます。
ネガティブプロンプトってなに?
生成して欲しくない要素をネガティブブロンプトと言います。
例えば、女の子の画像生成している最中に、突然メガネをかけたバージョンが生成されます。メガネをかけて欲しくない時には、ネガティブプロンプトにglasses (メガネ)と指定することで、メガネバージョンの登場確率が下がります。
ネガティブプロンプトを使わずとも画像生成はできますが、失敗画像の登場を減らし、最短で狙った画像を出すためには必須です。
プロンプトのテクニック
強調(Prompt weight)
プロンプトを、強調したいときに使うテクニックです。
プロンプトに「重み(weight)」と付けることで優先度が上がります。
プロンプトを()で囲む
数字を付与する
例:(((medium heir))), best quality, japanese girl, (RAW photo:1.2)…….
さいごに
Stable Diffusionで画像生成をするため、プロンプトについてまとめました。習うより慣れろ。
頭ではなく手を動かすことで「自分の課題」が見つかるはずです。
まずは課題を見つけるために画像生成を繰り返すのみです。