![見出し画像](https://assets.st-note.com/production/uploads/images/155059173/rectangle_large_type_2_ce98a89c03250e9e99b823be62e6b498.png?width=1200)
[画像AI] もうPrompt(呪文)は書くな
もう書くのは面倒くさい
AI画像生成といえば何らかのpromptまたは”呪文”と呼ばれる
文章を書いてAIによって絵を作成するという流れだが、
最近ではそれも不要なのではないか・・と思われる。
見本の呪文では・・
#リアル系の呪文
Masterpiece, Best qualilty, Photorealistic, extremely detailed,8k, RAW photo,
4k, incredibly absurdres, highres, highest quality,16K human skin closeup,
super high resolution, HDR (狂ったような品質指定~
1girl, solo,(人物やポージングなど~
dramatic, cinematic lighting, soft light, digital SLR camera,
Detailed Background, Volumetric lighting, Sharp focus, Super Realistic Skin,
Detailed face,(執拗なシャープ、ディテール、美貌の指示~
このように見るのもうんざりしてしまうような文面が続く^^;
概要としては「品質指定」「人物指定」「背景」などで
構成されており、後はモデルやLora、解像度や生成枚数等を
設定して出力する。
Excel表や呪文サイト
自力でやっていた時代もある。例えばExcelに呪文表をつくり、
vlookup関数などで呼び出して作成したこともある
![](https://assets.st-note.com/img/1726867655-dPT4fyNp2k1QtLgcawA58GJF.png?width=1200)
他には下記のような呪文生成サイトを利用するのも手だ。
しかし、ただ選ぶだけでも飽きてくるものなのだ。
![](https://assets.st-note.com/img/1726872542-8mW1SRMcaDdwUIJECyfbxngN.png)
Chat GPT先輩にお願いする
GPT3は無料版だがそれらしいpromptを生成できる。GPTで
呪文を書いてくれと頼む。
![](https://assets.st-note.com/img/1726869813-CvxZuedI2wlOAnSh0Hr1mWJ8.png?width=1200)
「女子高生がファッションショーで颯爽と歩く姿」を要求したが、英語の
流暢な文章を出力した。このpromptをFLUXにコピーして画像を出力した。
![](https://assets.st-note.com/img/1726869976-TUlQb5njIGRO4otCsAKqWuHr.png)
FLUXは呪文理解力と再現性に優れているといわれる。しかし、
・・女子高生と指示したが、国籍も何も指定しなかったためか
海外の子供が出力された。ポージングが合っていれば良いと思い
この画像をこのままリファレンスする。
![](https://assets.st-note.com/img/1726870073-Ff4E6BA5wahsTpeyJYUuZtnc.png)
次にSeaARTの広場に公開されていたポートレートを
引用して、promptもモデルもLoraも何もかもそのまま引用し、
さらに、先ほどのGPTのprmptを追加してリファレンスした。
![](https://assets.st-note.com/img/1726870681-RtVQ6Oarw5cfjexmIF7kN328.png?width=1200)
上記のように画像を生成できた。一切promptには手を加えていない。
コピペしただけである。もっとも、これは割とうまくいった場合であって、
実際には微調整が必要な場合が多いだろうし、そもそも公開されたモデルが
学習していないオブジェクトは生成できないので別途Loraを追加したり、
諦めて別の表現で代用したりと変更する場面もあるだろう。
また、解像度を上げるとバグが増えやすくなるので、その点もくまなく
探す必要があるかもしれない。エラーや追加したいものがあれば
インペイント系のツールで追加する
![](https://assets.st-note.com/img/1726874297-tecYnmUHuWbB30jrsEkQ1K8N.png)
なお、リファレンス画像無しで、promptだけで出力したところ
だいたい次のようになった。
![](https://assets.st-note.com/img/1726874494-DSb2GidOY5KkZzEJsHBA1vlx.png)
Stable Difussion系ではプロンプトのみでの指定はなかなか思い通りに
行きにくい。コントロールネットやi2iを駆使したい。
プロンプトマジック
サービス会社によってはプロンプトマジックという名のサービスを
提供しているところもある。入力されたpromptを改善する機能だ。
![](https://assets.st-note.com/img/1726876181-YUNPmVMGoR2zpuSsF7LraeWx.png)
Lenardo AIではPHOENIXを使用するとpromptを自動で
最適な呪文に変更して画像を生成する。
![](https://assets.st-note.com/img/1726876404-kQqlXEyirda0Uz2HJSVctMn7.png?width=1200)
SeaARTもプロンプトマジックが用意されている。先ほどと同じ
プロンプトでファッションショーのランウェイの様子がうまく
表現されている。
![](https://assets.st-note.com/img/1726876602-crqkIjepbDloxUsgz6BKEwvC.png)
他にもNight Cafeなどのサービスでも用意されている。
普通の文章を入力しても問題なさそうだ。
一つ戻ってここでもGPTかもしれない。有料だがGPT4なら
DALL-E3が使用できるので、簡単に画像を生成できる。
品質に不満ならそれをリファレンスしてもいいだろう。
画像からpromptを抽出
![](https://assets.st-note.com/img/1726883014-8swcjWlJ3oHEMKtUnb6Y7GyA.png?width=1200)
ネットを楽しむと気に入った画像が見つかるかもしれない。
Stable Diffusionの基本機能で画像からPromptを抽出できる。
特に抽象画は文章にするのが難しいのでこの機能を使う。画面の
キャプチャはWindowsキー+Shift+Sキーでできる。念のため。。
転載あるのみ!
CivitAIやSeaARTではたくさんの作例が公開されており、
すでに画像生成に成功したプリセットであるからこれを
引用するのが吉である。
特にCivitAIに関しては最もテストしているであろうモデルの制作者が
作例を上げているのでそのまま引用しよう。
後は先ほどと同じようにGPTで作成したpromptを追加してまずは
うまくいくか試してみる。
自分でpromptを書くべきではない理由
・・書くべきではない。というのもどの作例を見てもpromptは
一貫性が見えない。つまり、モデルなどによって調整が必要になる。
その都度最適なpromptを探るのは疲れるし、そもそも役に立たないし、
自己成長もしない。なぜならうまくいく、いかないがAI側の問題が多く、
ある問題が解決しても別の場面でそれが生かされるわけでもないからだ。
AIだから素早く何でもできると思いがちだが、実際には時間と労力が
発生している。やっていると分かるのだが、非常に眠い。つまり、何の
刺激もないことをやっているのだ。「自分で絵を描いている」
ならまだしも、ただ自動で生成しているだけだ。
●人生は短い。
退屈なことをしている余裕はない。限られた時間を有効に使いたい
まとめ
大したことはないが、①promptを書くのはやめる。
②サイトから引用する ③GPTに書かせる
④再現性の高いサービスを利用する(FLUXなど
⑤画像リファレンスなどを駆使する
以上を守れば限られた、隙間時間に快適にAIを楽しめるだろう。
いいなと思ったら応援しよう!
![ガラクター(オールウェイズ](https://assets.st-note.com/production/uploads/images/154263140/profile_154a8573a597e62240d9f0f88da3aa8c.png?width=600&crop=1:1,smart)