画像生成AIのプロンプト作成の基礎の基礎
最近では、さまざまな生成AIがあり活用が進んでいます。
そんな中で注目されているのが画像生成AIです。
画像生成AIでは、プロンプトと呼ばれる文字列で指示することで、その内容に沿った画像を生成してくれます。
画像生成AIでは、実写さながらの高品質な画像を生成することができますが、意図した画像を生成するためには、プロンプトをうまく指示する必要があります。
そのため、生成した画像の完成度はプロンプトにかかっていると言えるでしょう。
ただ、文字が羅列しているプロンプトは一見内容がよくわからず、呪文のように見えてしまうかもしれません。
プロンプト集なども公開されているため、それを参考にして似た画像は生成できますが、プロンプトの意味がわからないため、修正ができないこともあるでしょう。
この記事では、そんな画像生成AIのプロンプトの基礎について解説します。
基本的な内容を理解すると、意図した画像を生成できるようになり、さらに公開されているプロンプト集などもうまく活用できるようになります。
(この記事で扱うプロンプトは、一般的な画像生成AI向けのプロンプトです。特定のAI向けではありませんが、ある程度互換性はあります)
画像生成AIのプロンプトとは?
画像生成AIでは、基本的にはプロンプトと呼ばれる文字列で生成する画像を指示します。
このプロンプトは、ほとんどが英語となっています。
(一部日本語に対応しているAIもあります)
プロンプトは、英語の短文や単語が羅列したような形になっています。
たとえば、
「Japanese woman, long Hair, at street」
(路地にいる長髪の日本人女性)
という形です。
そのため、英語が理解できればプロンプトを見ることでなんとなく内容がわかるようになっています。
プロンプトは一見呪文のように見えますが、各要素にはそれぞれ意味があります。
プロンプトは、AIに作りたい画像を文字で説明するもの、と考えるとわかりやすいでしょう。
プロンプトを作成するポイント
プロンプトは大雑把に設定してもそれっぽい画像を生成してくれます。
先程のサンプルの「Japanese woman, long Hair, at street」の場合でも、路地にいる長髪の日本人女性の画像が生成されるはずです。
ただ、このプロンプトの場合は、いったいどんな日本人女性なのか、どういう路地なのかが指示されていないため、画像を生成する度に違った画像が生成されます。
中には意図しない画像も生成されるでしょう。
自分の意図した画像を生成するためには、プロンプトでできるだけ詳細な情報をAIに伝えなければなりません。
Japanese womanだけでは情報が少ないので、
・年齢は何歳ぐらいか
・どんな見た目なのか
・どんな服装をしているのか
・どんなポーズをとっているのか
などを細かく指示する必要があります。
公開されているプロンプト集は、一つがかなり長いものが多いのですが、これは細かい情報を指示しているためです。
情報量が少ないと、生成する度に内容が異なる画像になってしまいます。
プロンプトを作成するポイントは、できるだけ細かい情報も伝えるということになります。
プロンプトの構成
プロンプトには、ある程度決まった構成があります。
構成を無視しても画像は生成されますが、構成に沿ってプロンプトを作成したほうが意図した画像が生成されやすくなります。
プロンプトは、どの画像生成AIでも共通で
「順番が前にあるものが優先される」
というルールがあります。
より確実に反映させたいものを前の方に記述するのがポイントです。
また、たいていのプロンプトは以下の順番で記載されています。
・画質に関するもの
・人物に関するもの
・人物の詳細
・背景
・照明など
また、特定のプロンプトを強調することもできます。
多くの画像生成AIでは、()で囲むことでその部分をより強調できます。
括弧は複数重ねることも可能で、さらに強調できます。
また、括弧内に数値を書くことで倍率を直接指定できます。
画質に関するもの
「画質に関するもの」とは、生成される画像の品質を高めるためのプロンプトです。
masterpiece、high qualityなどが定番で、プロンプトの最初に記載することが多くなっています。
画質に関するプロンプトはほぼ内容が同じなので、一種のおまじないのような感じで記載するといいでしょう。
人物に関するもの
「人物に関するもの」は、どのような人物の画像を生成するのかを大まかに指示します。
(人物の画像を生成する場合)
・どういう人物なのか
・年齢
などを記載します。
人物の詳細
「人物の詳細」は、先程指定した人物の詳細な情報について記載します。
人物の場合は、
・髪型
・表情
・衣装
・ポーズ
などを指定します。
人物の画像を生成する場合、この部分が重要になります。
背景
「背景」は、文字通り画像の背景について記載します。
人物の画像の場合は、人物がいる場所についての情報を記載するといいでしょう。
照明など
「照明など」は、人物がどういった環境にいるかを記載します。
屋外にいて日光が当たっているのか、室内で照明の光なのか、といったことを記載します。
プロンプトを作ってみよう
では、実際にプロンプトを作ってみましょう。
今回作成する画像はこれです。
まず最初は画質に関するプロンプトです。
high quality,Photorealistic,high resolution
こんな感じでいいでしょう。
次は人物の指定です。
Japanese woman, 20 years old
さらに人物の細かい指定をしていきます。
beautiful and shiny straight semi-long hair, see-through bangs
髪型を指定しました。
large doe eyes, soft skin with natural glow, long eyelashes
顔などの特徴を指定しました。
wearing tank top and short pants
次は衣装です。
leaning on elbow at desk, looking directly at camera, innocent expression with faint smile
次はポーズの指定です。
elegant atmosphere
最後は照明などの指定です。
すべて組み合わせると、
high quality,Photorealistic,high resolution, Japanese woman, 20 years old, beautiful and shiny straight semi-long hair, see-through bangs, large doe eyes, soft skin with natural glow, long eyelashes, wearing tank top and short pants, leaning on elbow at desk, looking directly at camera, innocent expression with faint smile, elegant atmosphere
となります。
プロンプトだけを見ると内容がわかりにくいですが、各要素に分解すると理解しやすいのではないでしょうか。
プロンプトの作成は、このような形になります。
生成する画像の幅を広げたい場合は、プロンプトの各要素の細かい指定をいくつか用意しておき、それを組み合わせることで可能になります。
この要素については、公開されているプロンプト集から抜き出すこともできますし、AIによっては他の人が作成した画像が見れますので、その画像のプロンプトから抜き出す方法もあります。
プロンプトは要素をパズルのように組み合わせることで比較的簡単に作成できます。
また、AIなどを使って日本語で書いたプロンプトを英語に翻訳してもらうのもいいでしょう。
AIにプロンプトそのものを考えてもらうという方法もあります。
プロンプトを微調整
さて、プロンプトを作成して画像を生成できました。
ただ、生成された画像が思っていたものと違うということはよくあります。
この場合は、プロンプトの微調整が必要になります。
書いたはずのプロンプトが反映されていない、指示したものと違ったものが生成されている、ということはよくありますので、修正が必要です。
プロンプトが反映されていないのであれば、順番を前に移動させたり、()で囲って強調する方法があります。
また、プロンプトを別の表現に変更してみるのもいいでしょう。
意図する画像に近づけるためには、何度も微調整が必要になります。
まとめ
ここまで、画像生成AIのプロンプトの基礎について解説しました。
プロンプトは一見呪文のように見えますが、それぞれには意味があります。
また、プロンプトはある程度構成にわかれているため、構成別に見るとわかりやすいでしょう。
プロンプトは各要素を組み合わせることで作成できますので、他のプロンプトや画像などから参考にすると効率的です。
微調整など試行錯誤が必要ですが、ある程度思った画像は作成できるようになるはずです。
最後に少し宣伝になりますが、この内容を加筆修正してサンプルプロンプトを追加したものをKindleにて販売しています。
Kindle Unlimitedにも対応していますので、加入者なら追加料金なしで読むことができます。
よろしければお願いします。
この記事が気に入ったらサポートをしてみませんか?