AnimagineXL(3.1)試してみた
前回の記事で、StableDiffusionの派生をChatGPTやwikipediaなどを使って調べていましたが。。
そこで気が付いたのですが、AnimagineXLって、ずっと普通の?誰かが作ったようなMODELだと思ってたのですが、ただのMODELとは、ちょっと違うようですね。
※そもそも XL とか末尾についているのが高品質の証
で、さっそくNoteタイトルを作ってみたのですが、クオリティ高っ!!
背景とかも、すごい綺麗じゃないですかっ!!
結局、プロンプトをいじって、今まで作ってたキャラクターに寄せてみましたが、最初から、このモデルを使っていれば良かったのでは。。
昔、適当に使ってみたら、アニメというよりギャグ漫画のようなイラストが出来上がったので、放置してました。てきとうは良くないです。
Civitaiリンクは下記になります。
※4.0も出ています
AnimagineXLのお勧めのプロンプトと作り方について
AnimagineXLは、特殊タグが実装されているようで、一部のタグが非常に効果的に発動するようです。これより下はHuggingFaceのAnimagineXLについての説明を一部翻訳しました。
タグの順序
最適な結果を得るには、次のようにモデルをトレーニングするため、構造化されたプロンプト テンプレートに従うことをお勧めします。
特別なタグ
品質修飾子
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%
評価修飾子
safe 一般的な
sensitive センシティブ
nsfw 疑わしい
explicit, nsfw 明示的
年修飾子 ※ビンテージのアニメアートスタイルに変更可能
newest 2021年から2024年
recent 2018年から2020年
mid 2015年から2017年
early 2011年から2014年
oldest 2005年から2010年
美的タグ
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27
推奨設定
以下のネガティブプロンプト設定が推奨されています。
また、以下の設定で質の高い画像が生成されます。
約 5 ~ 7 の低いCFG スケール、30 未満のサンプリング ステップ、およびサンプラーとして Euler Ancestral (Euler a) を使用することを推奨
マルチアスペクト解像度
このモデルは、次の寸法での画像の生成をサポートしています。
1024 x 1024 1:1 スクエア
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 横
768 x 1344 4:7 縦
1536 x 640 12:5 横
640 x 1536 5:12 垂直
さっそくAnimagine推奨の設定を試してみる
基本的な推奨プロンプトを入れてみる
公式記載の内容から、以下の基本的な推奨設定とプロンプトで生成してみました。「1girl」を入れているだけなのでランダムな画像になるかと思いますが、ステップ数やCFGは少な目にしています。これらはプロンプトの再現度なので、少ないほうがMODELに身を任せる感じになるかと思います。
Sampling method : Euler a
Schedule type : Automatic
Sampling Step : 20
CFG Scale : 5
以下、生成された画像です。
キャラクター名を入れてみる
先ほどと同じです。推奨タグ順序に「character name」と書いてあるので、猫型ロボットの名前を入れてみます。。。先ほどと同様にステップ数やCFGは少な目にして、MODELに身を任せる感じで設定します。
Sampling method : Euler a
Schedule type : Automatic
Sampling Step : 20
CFG Scale : 5
タグの順序に従って以下を入れてみました。
以下、生成された画像です。
適切なプロンプトは、もうちょっと詳しく調べていきたいと思います。。
↓↓ 下記でプロンプトを試してみました