AI 初めの一歩/プロンプトの書き方

ShINC.MAGAZINE

2024年11月14日 15:05

プロンプトの書き方について、順序や構成を含めて解説します。

1. 基本的な順序

プロンプトは、全体の印象から詳細な要素へと順に構成するのが基本です。大まかには次の順序に従うと効果的です。
1. テーマや主題：何を描きたいか（例: "日本の若いモデル"）
2. 環境や背景：場所や雰囲気（例: "日本の古風な街並み"）
3. キャラクターや対象の詳細：姿勢、表情、服装など（例: "着物を着たモデル、微笑んでいる"）
4. スタイルや技法：アートスタイルや表現方法（例: "水彩風、ソフトな照明"）

2. プロンプトの具体性と順番

主題から詳細に向かう構成がポイントです。まず「大きなイメージ」を示し、そこから「小さなディテール」に進みます。例えば:
- 主題: "少女"
- 背景: "自然の中、湖のほとり"
- 詳細: "白いドレス、ロングヘア"
- スタイル: "夢幻的な雰囲気"

3. 強調と除外

強調したい要素は括弧でくくったり、()を用いてウェイトをかけられます（ツールによるサポートがある場合）。たとえば、「(赤い花)」とすれば、赤い花の要素が強調されます。
除外する要素（例えば「不要な背景」）は、「negative prompts」に記述するか、直接「要らない要素」を指定して省きます。

4. 橋上（ブリッジング）

橋上とは、プロンプト内の異なる要素を自然につなげる手法です。「背景」と「キャラクター」をスムーズに結びつけることで、違和感のない画像生成が期待できます。例:
- "湖のほとりに立つ、白いドレスを着た少女"とすると、背景とキャラクターが結びつきます。

5. プロンプト例

例: "日本の若いモデル、京都の伝統的な街並みの背景に立っている、微笑んで、柔らかい光の中で、現代的なスタイル"

日本の若いモデル、京都の伝統的な街並みの背景に立っている、微笑んで、柔らかい光の中で、現代的なスタイルプロンプトにしてください

次のようにプロンプトを作成すると効果的です：

"Japanese young model, standing in traditional Kyoto street background, smiling, in soft light, modern fashion style"

このプロンプトの構成：

メインのテーマ: "Japanese young model"（日本の若いモデル）
背景: "traditional Kyoto street background"（京都の伝統的な街並みの背景）
キャラクターの表情や姿勢: "smiling, standing"（微笑んで立っている）
照明とスタイル: "in soft light, modern fashion style"（柔らかい光、現代的なスタイル）

各要素がはっきり分かれることで、視覚的にイメージしやすい内容になり、生成時の表現が具体化されやすくなります。

法則とは異なった順番を変えて書き換えてください。

異なる順番でプロンプトを構成すると、次のように書けます：

"In soft light, a modern fashion style Japanese female model, smiling, standing in a traditional Kyoto street background"

この順番では、光やスタイルの要素から始め、最後に背景で締めることで、イメージの中心が光やスタイルに移り、柔らかい雰囲気が強調されます。

正しい順番で「冬の京都」にしてください。

「冬の京都」を取り入れた正しい順番のプロンプトは次のようになります：

"Japanese female model, standing in a winter Kyoto street background, smiling, in soft light, modern fashion style"

ここでは背景として「winter Kyoto street」を指定し、冬の京都の雰囲気を加えています。

順番を変えたプロンプトにしてください。

異なる順番で「冬の京都」を取り入れると、次のように書けます：

"In soft light, a Japanese female model, in modern fashion style, smiling, standing in a winter Kyoto street background"

この構成では、光の雰囲気やスタイルから始めて、最後に「冬の京都」を追加することで、スタイルと雰囲気が先に強調され、季節感が締めの要素として際立つ形になります。

カンマで区切ってゆく方法と文章にする違いはなんですか？

プロンプトの書き方において、「カンマで区切る方法」と「文章形式」にする方法には、それぞれ特徴とメリットがあります。

1. カンマで区切る方法

特徴：カンマで要素を並列的に並べる形式で、要素が短く簡潔になります。
メリット：
- 解釈が明確：要素が並列的に扱われるため、AIがそれぞれの要素を独立して解釈しやすくなります。
- 要素の強調が簡単：特定の要素に重みをつける際も、カンマ区切りのまま追加が可能です（例：(smiling)や[soft light]など）。
- 生成速度が速い：短い単語が多く、AIが短時間で処理しやすいことが多いです。
使用例：
"Japanese female model, winter Kyoto street background, smiling, in soft light, modern fashion style"

2. 文章形式

特徴：一連の流れに沿って要素が記述され、全体として文脈が生まれる形式。
メリット：
- 自然な構図：文脈があるため、要素がつながりやすく、自然な構図やポーズになりやすいことが多いです。
- ストーリー性：場面を伝えたい場合に効果的で、背景や感情が一体化しやすくなります。
- 細かな指示が可能：文章としての流れがあるため、各要素に対する詳細な指示を追加しやすく、ニュアンスが出やすいです。
使用例：
"A Japanese female model is standing in a winter Kyoto street background, smiling gently, illuminated by soft light, dressed in a modern fashion style."

3. 違いと使い分け

カンマ区切りはシンプルで視覚的な情報を強調したいときや、指定要素が多くない場合に向いています。要素ごとにAIが独立して解釈しやすく、鮮明な要素を強調する効果があります。
文章形式は場面全体の雰囲気や連続性を重視するときに適しており、背景や登場人物の関係性がわかるため、より自然な構図を生み出しやすくなります。

1）規則に基づいて記述するのと順番を適当に記述する場合の違い 2）ハイフンで繋ぐのと文章にする場合の違いとメリットとデメリットを箇条書きにしてください。

1. 規則に基づいて記述する場合と、順番を適当に記述する場合の違い

規則に基づいて記述する場合

メリット：
- 解釈が安定する：AIが要素を正確に解釈しやすく、期待した結果が得られる可能性が高くなります。
- 明確な焦点：主題→背景→詳細→スタイルという順序で書くことで、主題が何であるかをAIが把握しやすくなります。
- 視覚的要素のバランス：規則的な順序により、全体の構図が整いやすくなります。
デメリット：
- 構成が固定されやすい：特定の順序に縛られるため、柔軟性が低くなり、創造性が制限されることがあります。
- 表現の幅が狭くなる：統一された順序に基づくため、同じような出力が得られがちです。

順番を適当に記述する場合

メリット：
- 創造性が広がる：順序を変えることで、生成されるイメージが異なり、意外性のある結果が得られることがあります。
- 柔軟なアプローチが可能：要素の順番を変えながらさまざまなニュアンスを試せるため、バリエーションが増えます。
デメリット：
- 解釈の不確定性：要素の解釈が不安定になり、AIが予期しない結果を生成する可能性があります。
- 視覚の一貫性が崩れる：焦点が定まらず、バランスが崩れた構図になることがあるため、イメージが分かりにくくなる場合があります。

2. ハイフンで繋ぐ場合と文章にする場合の違い、メリットとデメリット

ハイフンで繋ぐ場合

メリット：
- 短く簡潔：短いフレーズで指定でき、構成がシンプルになります。
- 視覚要素が強調されやすい：要素が短くなるため、視覚的な要素がダイレクトに伝わりやすいです。
- 高速生成：カンマ区切りと同様に、要素が明確なので、AIが比較的短時間で解釈します。
デメリット：
- 文脈が弱くなる：要素が独立しているため、全体の構図やつながりが不明瞭になりがちです。
- 複雑な関係性が表現しにくい：シンプルな要素を強調するには適していますが、ストーリー性や詳細な表現には不向きです。

文章にする場合

メリット：
- 文脈が豊かになる：文章として表現することで、AIが全体のつながりを理解しやすくなり、自然な構図が生まれやすいです。
- 関係性やストーリーが表現しやすい：背景や人物がどのように絡み合っているかを細かく指定でき、深い表現が可能です。
デメリット：
- 長くなりやすい：文章が長くなることで処理に時間がかかり、情報が多すぎて解釈が難しくなることもあります。
- 要素が埋もれやすい：文章にすると各要素が埋もれがちで、特定の要素が強調されにくくなる場合があります。

プロンプト内の特定の要素を強調する。

文章の場合()をつけて強調することはできないのですか？

文章形式でも、特定の要素を**()**で囲むことで強調することは可能です。文章の流れを保ちながら、特定のキーワードやフレーズにウェイトを置くことで、AIがその部分をより注目して生成する傾向が高まります。

例

"A Japanese female model stands in a (winter Kyoto background), smiling softly, illuminated by (gentle light), dressed in a (modern fashion style)."

()で強調する際のポイント

要素に集中させる効果：特に重要な要素に()を使うことで、AIがその部分を他の要素よりも強く解釈しやすくなります。
文脈とのバランス：文章の自然な流れを保ちつつ、特定の要素が強調されるため、構図の一貫性が失われにくいです。

注意点

強調しすぎない：文章内で多用すると、逆にどの要素が中心かわかりにくくなるため、適度に使うと効果的です。

**()**を使用して文章形式でも十分に強調を加えつつ、自然な流れでプロンプトを作成できます。

(smiling softly:1.5)という強調方は使えますか？

はい、**「(smiling softly:1.5)」**のように強調する方法は、多くの生成AIで利用可能です。この形式は、特定の要素にウェイトをかける際に使われ、数値（この場合は1.5）がその要素の重要度を示します。

この形式のメリットと使い方

強調の調整：数値を増やすと、その要素がより強調されます。例えば、「(smiling softly:1.5)」は、通常の「smiling softly」よりも強い微笑みの印象を与えます。
柔軟な表現：要素ごとに異なる強調度を設定できるため、複数の要素に個別のウェイトをつけ、細かく調整できます。

使用例

"A Japanese female model stands in a winter Kyoto background, (smiling softly:1.5), illuminated by (gentle light:1.3), in a (modern fashion style:1.2)"

この例では「smiling softly」「gentle light」「modern fashion style」にそれぞれ異なるウェイトがかかっており、各要素が適度に強調されるため、AIが意図を理解しやすくなります。

"A Japanese female model stands in a winter Kyoto background, (smiling softly:1.5), illuminated by (gentle light:1.3), in a (modern fashion style:1.2)"

注意点

ツールによって異なるサポート：すべての生成AIがこの形式をサポートしているわけではないため、利用するツールで機能が対応しているか確認してください。
強調のバランス：数値を高くしすぎると、他の要素が弱まりすぎる可能性があるため、適度な強調度にするのが効果的です。

このほかの強調するための書き方を教えてください。

1. 二重括弧（(( ))）で強調する

方法：単語やフレーズを**(( ))**で囲むことで強調します。括弧が増えるほど、AIがその部分をより強調して解釈するようになります。
例："A Japanese female model standing in ((winter Kyoto background)), smiling softly"
効果：特に重要な要素を強調しやすく、自然な構成で意図を伝えやすいです。

2. 重複記述で強調する

方法：同じ要素を繰り返すことで、AIにその要素の重要性を伝えます。生成に影響を与えたい場合、同じフレーズや単語を数回繰り返します。
例："A Japanese female model, winter Kyoto background, winter Kyoto background, smiling softly"
効果：AIがその要素を複数回解釈するため、強調が伝わりやすくなりますが、多用すると画像が不自然になることがあります。

3. 重み付きコロン（:）と数値による調整

方法：特定の要素の後にコロンと数値を追加し、要素の重要度を調整します。これは**「(element:1.2)」**のように記述しますが、0.5や2など数値によって強調度合いを変えられます。
例："A Japanese female model standing in winter Kyoto background, (smiling softly:1.8)"
効果：細かく調整が可能で、他の要素とのバランスを保ちながら特定の要素を目立たせることができます。

4. **ブーストマーク（や!）を使う方法

方法：要素をアスタリスク（**）で囲んだり、エクスクラメーションマーク（!）を用いたりして強調することがあります。
例："A Japanese female model, standing in winter Kyoto background, **smiling softly**"
効果：一部のAIモデルで使われる方法で、視覚的に強調したい部分をはっきり示すのに有効ですが、必ずしもすべてのツールで機能するわけではありません。

5. Negative Promptを活用して他の要素を抑える

方法：強調したい要素以外の要素をNegative Promptに入れることで、結果的に目的の要素が際立つようにします。
例：Prompt: "A Japanese female model, winter Kyoto background, smiling softly" / Negative Prompt: "sunny, summer, dark light"
効果：生成したくない要素を排除することで、他の要素が相対的に強調され、生成結果が洗練されます。

まとめ

これらの方法を適宜組み合わせると、より意図に沿った生成が可能です。

使う時はしれぞれの強調の仕方を混在しない方がいいのですか？

強調の方法を混在させることは可能ですが、慎重に使うのが効果的です。各強調方法には異なる効果とニュアンスがあるため、混在させるとAIが解釈に困る場合や予期せぬ結果になることもあります。以下に、強調方法を混在する際のポイントをまとめました。

1. 基本的には一種類で統一する方が安定する

たとえば、**(smiling softly:1.5)のように数値付きの重み調整だけで構成するか、((winter Kyoto background))**のように二重括弧だけで構成すると、意図がAIに伝わりやすく安定した結果が得られることが多いです。

2. 異なる強調方法を少量で組み合わせる

強調したい要素が複数ある場合、数値付きの重みと二重括弧のように、少数の方法を組み合わせると効果的です。
例："A Japanese female model standing in ((winter Kyoto background)), (smiling softly:1.5)"

3. 過剰な強調は避ける

強調方法を多用すると、AIがどれを最も重要と捉えるか混乱する場合があります。結果が不自然になりやすいため、必要な要素だけを強調し、ほかはシンプルに書くことをおすすめします。
例："A Japanese female model in a ((winter Kyoto background)) with (gentle light:1.3) and (modern fashion:1.2)" のように、最も重要な部分だけを強調する

4. Negative Promptと併用する

特定の要素を強調したい場合、Negative Promptを使って不要な要素を抑えると、全体の強調が自然になり、効果的です。これにより、強調方法の種類を多用せずに済みます。

結論

強調方法を混在させることは可能ですが、少数の方法に絞って明確な強調を行う方が安定した結果を得やすくなります。目的に応じて、必要な強調方法だけを使うとよいでしょう。

Negative Promptについて、 ImageFXやPhotoshopはネガティブプロンプトを記入するスペースがありませんがそのようなAI generatorではどのように記述すればいいのですか？

ImageFXやPhotoshopのような、Negative Promptの入力欄がないAIジェネレーターでネガティブな要素を指定する場合、以下のような工夫が効果的です：

1. プロンプト自体にネガティブ要素を排除する表現を加える

プロンプト内で、生成したくない要素を「without」や「no」といった否定的な表現で指定します。
例："A Japanese female model standing in a winter Kyoto background, smiling softly, without sunny light, no summer vibes"

2. 反対の要素を追加する

生成したくない要素の反対の特徴を加えることで、AIに望ましくない要素を避けてもらう方法です。たとえば「夏」を避けたい場合、「冬」を強調する要素を多く入れると効果的です。
例："A Japanese female model in a cold winter Kyoto scene, snow falling, in soft, diffused light"（これにより、夏や明るい日差しなどが避けられやすくなります）

3. 色や光の詳細を明示する

明確に望ましい色合いや光の特徴を指定することで、不要な要素が混ざるのを避けられることがあります。
例："In soft, muted winter tones, without bright colors or harsh sunlight"

4. タグやキーワードを使って制限をかける

PhotoshopやImageFXでは、タグやキーワードが重視されることが多いため、生成したい画像のタグに反対の要素を排除するキーワードを入れることで、AIの解釈が制限されます。
例："Japanese model, winter Kyoto, soft light, no summer, no bright sun"

これらの方法でプロンプトを工夫し、生成したいイメージから不要な要素を自然に排除することができます。

タグやキーワードとはどのようなことですか？

ここでいうタグやキーワードとは、生成したいイメージを具体的に指示するために使う短い単語やフレーズのことを指します。PhotoshopやImageFXなどの一部のツールでは、特定のキーワードを重視してAIが解釈するため、タグやキーワードをプロンプト内で上手に使うことで、望む結果に近づけることができます。

タグやキーワードの特徴

単語または短いフレーズで構成されることが多い。
それぞれが独立した情報として解釈され、AIが生成時に「この要素は必要」「この要素は不要」と判断しやすくなります。
直接的な指示として作用しやすいため、背景、色合い、スタイル、季節などを簡潔に指定するのに便利です。

例：タグやキーワードの使い方

「冬の京都で微笑む日本人モデル」を生成したい場合、以下のようにタグやキーワードを使います。

望ましい要素を列挙する
- "Japanese model, Kyoto, winter, traditional street, soft light, modern fashion"
- このようにタグとして要素を並べると、AIはそれぞれを独立した情報として受け取り、京都の背景や冬の雰囲気を表現しやすくなります。
ネガティブな要素をキーワードで排除する
- スペースがない場合、「no」を使って不要な要素を記述します。
- 例："Japanese model, Kyoto, winter, soft light, no bright sunlight, no summer vibes"
- このように「no」と書くことで、明るい日差しや夏の要素を避けるように指示できます。
スタイルを指示する
- スタイルや質感をタグで表すと、AIが特定のアートスタイルや質感をイメージしやすくなります。
- 例："watercolor style, soft focus, cinematic look"

タグやキーワードを使うメリット

簡潔に要素を伝えられる：余計な表現を加えずに、必要な要素を短く伝えることができる。
重要な要素を強調しやすい：タグとして並べることで、AIが生成時にこれらの要素をより強く意識しやすくなります。
不要な要素を排除しやすい：プロンプトの中で簡潔に「no」や「without」を加えるだけで、ネガティブプロンプトのように使えます。

タグやキーワードを活用することで、短く効果的なプロンプトが作成でき、AI生成がスムーズになります。

タグやキーワードを使う場合と、単語をカンマでつないでいく場合には、似ているようで細かい違いがあります。それぞれの方法には特徴と利点があるので、目的に応じて使い分けると効果的です。

1. タグやキーワードを使う場合

特徴：AIが要素を独立した情報として解釈しやすく、特に特定のテーマやスタイル、アート要素を指定する際に便利です。
用途：場面やスタイル、雰囲気のような抽象的な概念やテーマを伝えるのに適しています。
メリット：
- 重点が明確：キーワードによって要素が独立しているため、AIが各タグを重要な要素として強調しやすい。
- スタイルや質感が伝わりやすい：アートスタイルやカラー、季節などの大まかなテーマがしっかり伝わる。
デメリット：
- 詳細な表現には不向き：キャラクターの具体的な動作や表情など、細かい描写には少し不向きです。

例："Japanese model, Kyoto, winter, traditional street, soft light, modern fashion"

2. 単語をカンマで繋ぐ場合

特徴：個別の要素を並列的に並べることで、各単語やフレーズが独立し、AIがそれぞれを平等な情報として解釈する傾向があります。
用途：詳細な描写や特定の要素を強調したい場合に適しており、例えばポーズや表情、衣装などの具体的な指示に有効です。
メリット：
- 詳細な指示が可能：人物の姿勢や表情、服装などの具体的な情報を正確に伝えやすい。
- AIが解釈しやすい：単語やフレーズごとに重要度が均等に扱われ、AIが要素を独立したイメージとして認識します。
デメリット：
- テーマがぼやけることも：大まかなテーマやスタイルを伝える場合には、まとまりに欠けることがあります。

例："Japanese model, standing, traditional Kyoto street, soft light, smiling, winter season"

まとめ

タグやキーワードは、AIが抽象的なテーマやスタイル全体を捉えやすく、イメージ全体の雰囲気を伝えたいときに効果的です。
カンマで繋いでいく方法は、特定のディテールや動作を正確に指示したいときに向いています。

どちらも使用可能ですが、タグ形式は大きなテーマを伝えるのに適し、カンマで繋ぐ形式は詳細な指示に向いているため、必要に応じて使い分けるのが理想です。

大文字と小文字は違いがありますか？

一般的に、生成AIのプロンプトにおいて大文字と小文字の違いはほとんどありません。AIは大文字・小文字の区別に影響されず、単語やフレーズを解釈します。そのため、以下の点が大文字・小文字において重要となります。

大文字・小文字の違いに関するポイント

意味の解釈には影響しない
- **"Japanese model"と"japanese model"**のように、大文字・小文字の違いがあっても、AIの解釈にはほぼ影響がありません。同じ意味の要素として扱われます。
視覚的な区別としての役割
- プロンプトが長くなった場合、特定の単語や要素に大文字を使うことで、視覚的に重要な部分を強調する効果があるかもしれません。しかし、これは人間にとっての読みやすさのためで、AIの生成結果には影響しません。
一部の固有名詞には注意が必要
- アートスタイル、地名、ブランド名など、一部の固有名詞は大文字で書かれることが多く、その場合にのみ大文字で記載すると明確になることがあります。例えば、"Van Gogh style"と書くことで、特定のアートスタイルをAIが認識しやすくなることがあります。
特殊なケースとしてのAIモデル
- 一部のAIやツールは、特定の大文字・小文字の使い分けで異なる解釈をする場合もありますが、これは稀で、ほとんどのツールでは大文字・小文字の違いは無視されます。

まとめ

基本的に、大文字・小文字の違いを気にする必要はほとんどありません。人間がプロンプトを読みやすくするために使い分けても良いですが、生成結果にはほぼ影響がないと考えて問題ありません。

この記事が気に入ったらサポートをしてみませんか？