見出し画像

Chat GPTと共同作業で作るAI生成イラスト | 100日でComfy UIをマスターする備忘録 | #7日目

今日も早速やるぞ〜!
昨日,チェックポイントとLoRAの組み合わせはいい感じに決まったので,次はプロンプトの修正.2〜3日プロンプトのことをやってみて,うまくいかないようであればまた新たな組み合わせを探そう.
※あくまで私の100日の記録.自分が読み返しやすいように頑張ってわかりやすくしようとは思うけど...100日後の自分に向けた手紙だと思って書くかな〜.100日後に「いやこれってこういうことだよね?」「これでうまくいくよ!」って自分の記事にツッコミ入れられるようになりたい.


Chat GPTで100点のプロンプトを作る

60点プロンプトを与えることで,100点にしてくれるそう.
具体的には,こんな感じで自分がかいらプロンプトをAIに添削してもらう.

あなたはプロのAIイラストレーターです. Comfy UIを使って,添付した画像のような場所でライブをしている女の子の画像を生成したいです.60点のプロンプトを,条件を反映させた100点のプロンプトに書き換えてください.

条件にはチェックポイントやLoRA,サンプラーの情報が入っています!

で,生成されたプロンプトがこちら↓(課金してないから無料版)

(masterpiece, best quality, amazing quality, ultra-detailed, cinematic lighting, hyperrealistic, 8k, newest, scenery, volumetric lighting, ray tracing, breathtaking visuals), 

1girl, silver hair, short hair, (blue eyes, perfecteyes:1.2), stylish and confident expression, dynamic pose, holding an electric guitar, performing live, singing passionately, standing on a futuristic neon-lit stage, wearing (single bare shoulder shirt:1.3), black short pants, stylish boots, black gloves, choker necklace,

(large futuristic concert hall:1.2), massive LED screens in the background, mesmerizing neon reflections on glass floor, colorful spotlights illuminating the scene, holographic visuals, refractions and reflections, cyberpunk aesthetics, dynamic camera angle (from below:1.3), low-angle shot, immersive atmosphere, stunning depth, highly detailed lighting effects, 

(vibrant neon colors:1.2), intricate stage design, dramatic and cinematic mood, audience silhouettes in the background, holographic visual effects enhancing the scene.

プロンプトのポイントまで解説してくれた!
「光の表現」:「volumetric lighting」「ray tracing」「breathtaking visuals」などを追加し、光の表現を強化。
「neon reflections」「holographic visuals」「dynamic lighting effects」などで、ステージの近未来的な演出を際立たせる。

「キャラクターのディテール」:「stylish and confident expression」「dynamic pose」などでキャラクターの雰囲気を強調。
「choker necklace」「black gloves」などのアクセサリーを追加し、ファッションの完成度を上げる。

「ライブ会場の雰囲気」:「large futuristic concert hall」「massive LED screens」「audience silhouettes in the background」などで、スケール感を演出。
「holographic visual effects」「colorful spotlights」などで、華やかさと未来的なビジュアルを表現。

「カメラアングル」:「from below:1.3」「low-angle shot」を強調し、迫力ある視点を作る。

ほう.キャラクターのディティールにはあんまりこだわってなかったからちょっと新鮮かも.具体的に「手を挙げて」とか,立っているとか,そんなことばっかり書いてたなぁ...
あと,比率を使って表現するのがイメージわかなくて,こればっかりは適当に試して感覚で何度か修正という感じになるのかな?

昨日設定したLoRAのオフショル?は,single bare shoulder shirt long, single bare shoulder shirt shortがキーワードなのでそれを追加して...(後から見たら入ってた.文字小さいのを言い訳に見逃してた...)

お,,,おう...笑

なんかのっぺらぼうが・・・
でも背景はいい感じになってきたし,ちょっと修正しようかな.
単純に,単語数が多すぎるような気もする.不要なLoRAも一旦省こうかな.なんかLoRA同士が喧嘩しているような気もする.

LoRA: Neon_Environments-SDXL(0.7), PerfectEyesXL (+色々抜き差し)
step: 28 cfg: 6.0 sampler: euler_ancestral, natural
prompt:
(masterpiece, best quality, amazing quality, ultra-detailed, cinematic lighting, hyperrealistic, 8k)
1girl, silver hair, short hair, (blue eyes, perfecteyes:1.2), stylish and confident expression, dynamic pose, holding an electric guitar, performing live, singing passionately, standing on a futuristic neon-lit stage, wearing black jacket, black short pants, stylish boots, black gloves, choker necklace,
(large futuristic concert hall:1.2), massive LED screens in the background, mesmerizing neon reflections on glass floor, colorful spotlights illuminating the scene, refractions and reflections, cyberpunk aesthetics, dynamic camera angle (from below:1.3), immersive atmosphere, stunning depth, highly detailed lighting effects, (vibrant neon colors:1.2), intricate stage design, dramatic and cinematic mood, audience silhouettes in the background, holographic visual effects enhancing the scene.

Single bare shoulder shirtなしver
さっきよりはいい感じ.お顔が五条悟っぽいと思ったのは私だけ?下アングルのせい?
pony_ani31_6_adamW-000021,Single bare shoulder shirtなしver
プロンプトとLoRA相性が悪かったのか?
今思えば,ponyってアニメっぽいキャラクターを強調する単語必要だったのかも.
てかよく見ると左目がツケマ取れたみたいになってる笑

うん,なんかponyはちょっと使い方を勉強した方がいいのかも.
あとは,同じような意味のプロンプトは1つにまとめて,強調しちゃうとか.
「ベース」の単語では多分出力できないんだね,エレキギターで出力して,ギターのディティールをプロンプトに入れていくような感じかな.

Chat GPTに修正指示

プロンプト通りにやったらこうなったよ,と画像とともにアニメ調でのっぺらぼうな顔を変えてと伝えると,

(masterpiece, best quality, ultra-detailed, highly detailed anime face, perfect face, (perfecteyes:1.3), expressive anime character, dynamic anime concert, 8k, breathtaking visuals, volumetric lighting, cinematic shading, anime-style shading, 2.5D anime aesthetics, soft anime rendering), 

1girl, silver hair, short hair, (blue eyes:1.2), confident and charismatic expression, standing on a futuristic neon-lit stage, holding an electric guitar, performing live, singing passionately, wearing (single bare shoulder shirt:1.3), black leather pants, stylish boots, fingerless gloves, choker necklace,

(futuristic concert stage:1.2), massive LED screens, glowing neon lights, vibrant and colorful lighting effects, dynamic reflections, immersive neon atmosphere, cyberpunk aesthetics, dramatic and cinematic composition, (from below:1.3), low-angle shot, backlight contrast, audience silhouettes in the background, dramatic depth of field.

ふむ,アニメ調って入れればいいんか.
今回の修正ポイントは,

<修正ポイント>
顔のディテール向上:「perfect face」「highly detailed anime face」「detailed eyes」「expressive anime character」などを追加
LoRA: PerfectEyesXL を考慮し、(perfecteyes:1.3) を適用

アニメ調の強化:「anime-style shading」「2.5D anime aesthetics」「beautiful detailed anime character」「soft anime rendering」などを追加
キャラクターのアニメらしさを強調

ステージ演出のブラッシュアップ:「dynamic anime concert」「colorful lighting effects」「stage atmosphere, immersive neon reflections」などで臨場感アップ
光の演出を強化しつつ、キャラが目立つように調整

うーーーーん,どうも相性悪いなぁ.ていうかこれは2.5Dが悪いんか?
そうなんこもanimeってプロンプト入れても意味ない気がする.

次ももはやみなくてもわかる笑

あはははは.

肩出しファッションのLoRAが入ってたのは一旦なしにして,お次はこちらで.

LoRA: Neon_Environments-SDXL(0.7), PerfectEyesXL, pony_ani31_6_adamW-000021
prompt:
(masterpiece, best quality, ultra-detailed, highly detailed anime face), 1girl, silver hair, short hair, perfect face, (perfecteyes:1.3), (blue eyes:1.2), confident and charismatic expression, standing on a futuristic neon-lit stage, holding an colorful painted electric guitar, performing live, singing passionately, wearing red jacket, grey pants, red shoes, black gloves, choker necklace, (futuristic concert stage:1.2), massive LED screens, glowing neon lights, vibrant and colorful lighting effects, dynamic reflections, immersive neon atmosphere, cyberpunk aesthetics, dramatic and cinematic composition, (from below:1.3), low-angle shot, backlight contrast, depth of field

※Kサンプラーは同じにしています
わーお,若干寄り目な気はするけどやっぱりChat GPTのプロンプトはしつこいんだな.

さらに修正指示(2回目)

さっき↑のプロンプトと条件,生成された画像を送って修正指示
その結果がこちら.

(masterpiece, best quality, ultra-detailed, highly detailed anime face, beautifully detailed face, (perfect face:1.3), (perfecteyes:1.4), expressive detailed anime eyes),
1girl, (shiny silver hair:1.2), short hair, slightly windblown hair, dynamic strands, (blue eyes:1.3), confident and charismatic expression, slightly smirking, passionate gaze, standing on a futuristic neon-lit stage, (dominant perspective:1.3), one foot stepping forward, holding a (custom-painted electric guitar:1.3), vibrant colors, glowing accents, (glossy finish, reflective details), performing live, singing passionately, wearing a (red jacket:1.2), grey pants, red shoes, black gloves, choker necklace,
(futuristic concert stage:1.2), massive LED screens, holographic projections, pulsating lights, glowing neon lights, vibrant and colorful lighting effects, dynamic reflections, immersive neon atmosphere, cyberpunk aesthetics, dramatic and cinematic composition, (dramatic neon glow:1.3), immersive neon reflections, stage fog, (from below:1.4), low-angle shot, backlight contrast, depth of field, (faint silhouettes of cheering crowd).

🛠 修正ポイント
顔の魅力をさらに強調:perfect face の強調度を上げ、beautifully detailed face を追加
目の輝き・立体感を強化 :((perfecteyes:1.4), expressive detailed anime eyes)
表情に感情を加える :(confident and charismatic expression, slightly smirking, passionate gaze)

髪のディテール向上:silver hair の shine を強調 ((shiny silver hair:1.2))
動きのある髪を演出 :(slightly windblown hair, dynamic strands)

服装・ポーズをさらに洗練:red jacket, grey pants, red shoes, black gloves, choker necklace はそのまま
足を強調し、構図のダイナミズムをUP :((dominant perspective:1.3), one foot stepping forward)

ギターの質感UP & 魅力強化:colorful painted electric guitar をより詳細に ((custom-painted electric guitar:1.3), vibrant colors, glowing accents)
ギターの光沢・反射を強化: ((glossy finish, reflective details))

ステージの雰囲気をさらに強化:futuristic neon-lit stage の情報を追加 ((holographic screens, pulsating lights, stage fog))
ネオンの反射・照明効果をブースト: ((dramatic neon glow:1.3), immersive neon reflections)
観客のシルエットを追加 :((faint silhouettes of cheering crowd))

長いんじゃ.長すぎる.とりあえず信じて生成するけど・・・
処理できる限界の単語数を越えてるんじゃないか?
あと,silhouettesって何?知らん単語出てきた...と思ったら.これでシルエットなんだ.英語読みじゃなさそう.フランス語か?(フランス語全然できないけど.最近,ようやくsalut!がhelloっていうことを知ったレベル)
でもさっきよりは繰り返すようなプロンプトじゃないかも.しつこく同じような単語にするくらいなら潔く強調した方がいいってことかな.

ああああああ!惜しい!右手が・・・🥲

ネガティブプロンプト,何にしてたっけ?

めっちゃいい感じだ,仮説はあってそう.
背景の聴衆はいらんのと,手の表現をなんとかするか...
ということでちょっと調べてみると,ネガティブプロンプトで防げるということで自分のをチェック.

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

Animagine XLのおすすめを入れていたので,bad fingers, bad hands, missing fingersを適当に追記(こういうところも順番関係ありそうだな...)

うむ...さっきよりは?グーで握っていると思えばいいか.(要はよくない)
でもイラスト全体はすごくいい.

あと,仮説というかポイント?としては最初の画質のところに顔や特に細かく記載して欲しいところを入れておくとそこを重点的に書いてくれるのかな?

勝手に手のプロンプトを入れればちゃんと表示されるんじゃないかと思って入れてみると・・・

(masterpiece, best quality, ultra-detailed, highly detailed anime face, beautifully detailed face, (perfect face:1.3), (perfecteyes:1.4), expressive detailed anime eyes),
1girl, (shiny silver hair:1.2), short hair, slightly windblown hair, dynamic strands, (blue eyes:1.3), confident and charismatic expression, smiling, waving both hands, passionate gaze, standing on a futuristic neon-lit stage, (dominant perspective:1.3), one foot stepping forward, holding a (custom-painted electric guitar:1.3), vibrant colors, glowing accents, (glossy finish, reflective details), performing live, singing passionately, wearing a (red jacket:1.2), grey pants, red shoes, black gloves, choker necklace,
(futuristic concert stage:1.2), massive LED screens, holographic projections, pulsating lights, glowing neon lights, vibrant and colorful lighting effects, dynamic reflections, immersive neon atmosphere, cyberpunk aesthetics, dramatic and cinematic composition, (dramatic neon glow:1.3), immersive neon reflections, stage fog, (from below:1.4), low-angle shot, backlight contrast, depth of field

色々突っ込まなければ・・・笑

多分なくてもいい要素なので削除:strands, passionate gaze, stage fog,
しつこそうなので削除:vibrant colors, glowing accents, (glossy finish, reflective details),  glowing neon lights, immersive neon reflections,
追加:looking doem at viewer,

(masterpiece, best quality, ultra-detailed, highly detailed anime face, beautifully detailed face, (perfect face:1.3), (perfecteyes:1.4), expressive detailed anime eyes),
1girl, (shiny silver hair:1.2), short hair, slightly windblown hair, (blue eyes:1.3), confident and charismatic expression, smiling, looking doem at viewer, waving both hands, standing on a futuristic neon-lit stage, (dominant perspective:1.3), one foot stepping forward, holding a (custom-painted electric guitar:1.3), performing live, singing passionately, wearing a (red jacket:1.2), grey pants, red shoes, black gloves, choker necklace,
(futuristic concert stage:1.2), massive LED screens, holographic projections, pulsating lights, vibrant and colorful lighting effects, dynamic reflections, immersive neon atmosphere, cyberpunk aesthetics, dramatic and cinematic composition, (dramatic neon glow:1.3), (from below:1.4), low-angle shot, backlight contrast, depth of field

お!いい感じ!
あとは,目の中のディティールを描いたらもっといいかも.あと,もうちょっとキラキラした感じにしたい(語彙力)

さらに修正したかったけど,制限キタ・・・😒

しょうがないので,
「いい感じになりました!画像を,もっと暗めにして,ネオンの幻想的な空間にしたいのですが,100点プロンプトを参考に作成してくれますか? また,聴衆のプロンプトは不要です」
と入力.

ありがとう!🔥 さらに「暗めのネオン空間&幻想的な雰囲気」を強調するように調整したよ!

🛠 修正ポイント

全体の明るさを下げつつ、ネオンの光を際立たせる:low-key lighting (ローキーライティングで暗めに調整)/ moody atmospheric lighting, deep shadows (影を強調してドラマチックに)

ネオンの幻想的な光をブースト:ethereal neon glow (神秘的なネオンの光)/ diffused neon reflections (ぼやけたネオンの反射で幻想感UP)/ soft glowing particles in the air (空気中の小さな光の粒で幻想感演出)

背景をより幻想的なステージに進化:holographic stage effects, shimmering lights (ホログラム演出で未来感UP)/ misty stage fog with neon highlights (ステージにネオンが反射する霧)

ギターにも幻想的な輝きをプラス:glowing edge highlights on the guitar (ギターの輪郭が光る) / neon-lit guitar strings (ネオンに光るギターの弦)

🔥 幻想的な暗めのネオンステージ 100点プロンプト
(masterpiece, best quality, ultra-detailed, highly detailed anime face, beautifully detailed face, (perfect face:1.3), (perfecteyes:1.4), expressive detailed anime eyes), 1girl, (shiny silver hair:1.2), short hair, slightly windblown hair, dynamic strands, (blue eyes:1.3), confident and charismatic expression, slightly smirking, passionate gaze, standing on a futuristic neon-lit stage, (dominant perspective:1.3), one foot stepping forward, holding a (custom-painted electric guitar:1.3), vibrant colors, glowing accents, (glossy finish, reflective details), neon-lit guitar strings, glowing edge highlights on the guitar, performing live, singing passionately, wearing a (red jacket:1.2), grey pants, red shoes, black gloves, choker necklace, (futuristic concert stage:1.3), massive LED screens, holographic projections, pulsating lights, glowing neon lights, (ethereal neon glow:1.4), (diffused neon reflections:1.3), (misty stage fog with neon highlights:1.3), shimmering lights, cyberpunk aesthetics, dramatic and cinematic composition, low-key lighting, moody atmospheric lighting, deep shadows, soft glowing particles in the air, (from below:1.4), low-angle shot, backlight contrast, depth of field.

これでよりダーク&幻想的なネオン空間に仕上がるはず! 🎸💜✨
もっと細かく調整したいところがあれば、教えてね!🔥

両者,ずいぶん親しげだな(いつからこんなに仲良くなりましたかね?www)

ちょっとしつこさが残っているような気がするけど,まぁやってみよう.

うーん,ponyが邪魔だったりする?

Chat GPTはコンパクトなプロンプトを作れるのか?

とりあえず同じような意味のを1つにまとめてと依頼.さてさてどうなるか.

OK!同じ意味の表現を整理しつつ、コンパクトにしても効果が変わらないように調整したよ!🔥

🌌 幻想的な暗めのネオンステージ | 最適化プロンプト

(masterpiece, best quality, ultra-detailed, highly detailed anime face, perfect face, (perfecteyes:1.4), expressive anime eyes), 1girl, (silver hair:1.2), short, slightly windblown, (blue eyes:1.3), confident smirk, passionate gaze, standing on a futuristic neon-lit stage, (low-angle:1.4), dominant perspective, one foot stepping forward, holding a (custom electric guitar:1.3) with a glossy finish, glowing accents, neon-lit strings, performing live, singing passionately, wearing a (red jacket:1.2), grey pants, red shoes, black gloves, choker, (futuristic concert stage:1.3), massive LED screens, holographic projections, pulsating neon lights, (ethereal glow:1.4), misty stage fog, shimmering reflections, cyberpunk aesthetics, (moody low-key lighting, deep shadows:1.3), cinematic composition, soft glowing particles in the air, backlight contrast, depth of field.

✨ 最適化ポイント
重複していた表現を統一(例: "holographic stage effects" → "holographic projections")
シンプルでも意味を損なわないように整理(例: "dominant perspective" を "low-angle" に統合)
キーワードの強調を維持((xxx:1.3) の調整で重要要素を保つ)

これで無駄なく、スッキリしたプロンプトになったよ!🔥
もっと調整したいところがあれば教えてね!🎸💜✨

なんだこいつ?急に馴れ馴れしくしやがって()
お〜〜〜〜やればできんじゃん(((((お前何様

クールな感じで,いい感じ.
若干,腰柔らかいのね?みたいな感じはするけど有り得んくはないかな?多分.
ボブでまとまっているヘアスタイルもかわいいな〜
あ,よくみると左手の指の感覚が変か...
次回はネガティブプロンプトでコントロールかな〜.

今日はこんなところで.

1個の生成に私のマシンスペックだと5分くらいかかるのでいい加減もう少し軽い(ワークフローとかチェックポイント)ものにしたい・・・
去年の3月に買ったばっかりなのに,こんなにAI生成をすると思ってなかった(というか購入した時はAIなんて使ってなかった)から,GPUとかメモリとか考えずに購入してしまった.ギリギリComfy UIが使えるからラッキーだけど...(少しケチったけど,メモリひとつ増やしておいてよかった)
確かに,Proを買うかメモリをもっとバカデカくしてもよかったな〜と若干後悔しつつ,予算はなかったし,AI生成とOfficeを使う時くらいしかおっっそとはならないからこんなもんかなぁ.Officeはすぐ止まるから結構腹立つけど.(使っているエクセルデータが重すぎるの方が悪い)

まぁ,課金してMidjourneyとか使えばマシンスペック関係ないんですけどねぇ〜〜〜〜〜.恐るべし課金.


いいなと思ったら応援しよう!