画像生成AI小技？などについて (主に Stable Diffusion について)

2024年11月6日 22:58

Stable Diffusion もかれこれ Note のタイトル用などの作成でだいぶお世話になり、いろいろコツを掴んできたように感じています。初心者向けなのかもしれませんが、今回は、そのウンチクやコツについて note 記事にしてみました。

モデルを探す (StableDiffusion)

モデルの取得方法とサンプルを真似することの重要性について

とりあえずモデルを取得したらサンプルを真似する

CIVITAIでモデルをダウンロードして実際に試しても、サンプルで見た画像と全然違うイラストになる！！と思うときがあります。。
そんなことにならないように、CIVITAIで好みのモデルを見つけたら、まずはサンプルのプロンプトをそのままコピーして１回作ることをお勧めします。
何故かと言うと、自分で書いたプロンプトは全然、今見ているモデルのサンプルと違う表現となるプロンプトが含まれていることがあるからです。。
好みのモデルを見つけたらまずはサンプルを真似して１度作る。
シード値からパラメータまで、全て１度真似したほうがいいです
その後に好みのプロンプトを付けたり、減らしたりしていくと、検索時に見た、サンプルに近い理想のイラストに近づけます。

CivitaiはNSFWだらけなので、SeaArtのほうが最近良い？(というか見やすい)と思ってきてます。。

プロンプトの記載について

いろいろプロンプトを入れていて分かってきたこと？基本的は話かもしれませんが、共有したいと思います。

プロンプトの強調について

プロンプトは記載位置と強調する倍率でバランスを調整でき、最初に出るプロンプト程、強調されます。また、(nsfw:1.4)など、かっこで囲んで強調したい数字を入れると強調されます。
※1は1倍で2以上を入れると他のプロンプトが無視される程、強調されてしまいますので2以上は入れないようにしましょう。
ちなみに nsfw はヌードなど過激な画像になるプロンプトですw
そういうイメージはお断りな場合はネガティブプロンプトにnsfwを入れましょう。

ニュアンスが異なるワード(プロンプト)、類似語ついて

girlとwomanなど、女性として同じイメージでワードを入れると、結果が全然違います。「類似語」ってやつですね。。。なかなか気が付かなかったのは私だけでしょうか？💦girlは少女なので、年齢が下がるんですね。。。womanは女性なので、大人などになります。

この例は、よくわからんかも。。。girlはデフォルメされた感じになりやすくなる。

たとえば、規制もかかる ImageFX などで露出が高いワードをgirlで入れると全然出ませんｗ
boyやmanなども同じです。似ていても違う意味合いがある英語に注意しましょう。当たり前ですが、出来上がるイラストも全然違います(^^;)
例として、生成AIで結果が変わりそうな類似語をChatGPTに出してみてもらいました。

man / boy - 成人男性と少年で年齢や服装が違う。
cat / kitten - 成猫と子猫で姿や雰囲気が異なる。
car / sports car - 一般車とスポーツカーでデザインが異なる。
castle / palace - 防御的な城と豪華な宮殿で構造が異なる。
house / cottage - 一般的な家と田舎の小屋で雰囲気が違う。
robot / android - 機械的なロボットと人間型のアンドロイド。
forest / jungle - 北方の森と熱帯密林で環境が異なる。
building / skyscraper - 一般建物と超高層ビルで高さが違う。
ship / sailboat - 大型船と帆船で船の形や風景が異なる。
road / path - 舗装道路と自然の小道で景観が異なる。

プロンプトに記載されている部位は表示される

たとえば全身を入れたいとき「full body」などのワードを入れることがあるかと思いますが。実は？足に関するワード、たとえばキレイな足「beautiful feet」などのワードがあれば足まで入るので、勝手に全身のイラストになります。
逆に上半身のイラストを作りたいのに足や靴に関するワード「feet」や「boots」などが入っていると自動的に全身になりやすくなりますので注意しましょう。

だいたいOKならimg2img/Cotrolnetで加工すればOK (StableDiffusion)

なかなか理想の画像に近づけないときや、余計な画像があることがあるかと思いますが、img2imgやControlnet を使って加工すれば好みの画像に近づけます。たとえばピースサイン(peace sign)などを入れても指が３つになったり、足が３本など。。。修正箇所を再作成すれば、部分的に再チャレンジしてくれます（できるだけネガティブプロンプトなどでフォローはしたほうがいいですが）
※ちょっとimg2imgなどの使い方は、また今度？今回は割愛させていただきます

キャラの固定、方向性などについて

体に関するプロンプトはキャラを固定化する

体系に関するプロンプトは入れたほうがいいことに今更ながらに気が付きました。中乳？「midium breasts」など入れたら、ぺったんこやら大きくなったり不安定だったのが落ち着きましたｗ
必要に応じて身長や体系なども入れてもいいかと思います。
あとは髪型、髪色あたりのプロンプトなど体に関するプロンプトは入れれば入れる程、キャラが固定されていきます。
ちなみにシード値で再現するのもいいかもしれませんが、いろいろな表現がランダムに出てくるのが好きなので、私はプロンプト派です。
たまたま出来た画像など、場合によっては画像をChatGPTに投げて「再現度の高いプロンプトを作成して」と伝えてプロンプトを新しく作ることも効果的かと思います。

まとめ

画像生成AI を使う上で、モデル選びやプロンプトの工夫、img2img の活用方法など、様々なポイントを紹介しました。これらのコツを踏まえながら、より良い生成結果を得るための参考にしてみてください。

いいなと思ったら応援しよう！

よろしければサポートお願いします🙏いただいたサポートは更新の活動費に使わせていただきます！