見出し画像

Illustriousおすすめモデル

随時更新
ほぼNoobAIモデル紹介
ローカル環境でアニメ調のイラストを出すなら現状一強のモデル
リアル調はFLUX使えばいいじゃんと思ってるのでそっち系のモデルは入れてません

目次


Illustrious-XL

環境

使用するPCはGPUのVRAM12GB以上
メモリ32GB以上推奨

簡単導入はここから

画像のサイズ

1024x1024
1152x896
1216x832
1344x768
1536x640

プロンプト

ポジティブプロンプト

illustrious0.1
masterpiece, best quality, good quality, newest

masterpiece > best quality > good quality > average quality > bad quality > worst quality


NoobAI
masterpiece,very awa,
best quality

品質タグ
masterpiece > best quality > good quality > normal quality > worst quality

美的タグ
very awa >>> worst aesthetic

解像度
incredibly absurdres
(over 10000) >
absurdres(3200×2400) >
highres(1600×1200) >
lowres(500×500)
SDXLの場合highresの解像度が最適な気がする
生成するサイズに合わせてある程度変えてもいいかも?

detailed
描き込み量を増やす、ultra detailedはより強い効果があるがマイナスに働くこともある

strong rimlight / Volumetric Lighting
陰影や光の反射などが追加され質感が上がる
ライトそのものが出ちゃうこともある


年代
oldest(~2017年)、old(~2019年)、modern(~2020年)、recent(~2022年)、newest(~2023年)

レーティング
general→sensitive→questionable→explicit

複数の人数表記

複雑なプロンプトを書く際のコツ?

  • CFGを高めにする

  • プロンプトの影響範囲が広いものから順番に記述する

  • 画面の上から順に記述する

  • 複数を出力する場合、メインで描く主役を決める

  • 大まかな輪郭・全体像を決定するプロンプト→それを修飾するプロンプトの順で記述する

  • カメラと人数指定のプロンプトは性質が似ていて画面全体への影響がとても強いので使用は最低限にすること

※構図・カメラ?

共通の動作

人数

boy+説明文・girl+説明文

周囲の環境や風景

画風→品質→年代→レーティング

※構図・カメラ?

隣接するプロンプト同士はカンマで区切っても互いに影響を受ける
noobは自然言語でも学習しているので通常のタグのプロンプト同士も短いものであれば混ぜて認識させることができる

複数出力

illustriousベースのモデルは2~3人までの複数出力で
影響範囲の狭い短いプロンプト(表情など)を個別にプロンプトの記述のみで指定することが出来る
ただし色々と制限がありどこまでできるかは何をするかによって変わる
詳細にたくさん書けるのは一人の人物だけ
主役と複数の脇役になる
それ以外は表情などの影響範囲が狭いもののみ、タグも一つか二つしか使えない
また、アクション+anotherと書くことで他人への行動として指定できたりできなかったりする

ネガティブプロンプト

illustrious0.1

lowres,(worst quality, bad quality:1.2),bad anatomy,sketch,jpeg artifacts,signature,watermark,old,oldest,


NoobAI

worst quality,worst aesthetic,poorly drawn,source filmmaker (medium),low quality,

worst aesthetic,worst qualityが特に効果的
ネガプロは盛り過ぎるとプロンプトの応答度が低下する
可能な限り限り減らした方が良い
そもそもネガティブプロンプトはモデルのテキストエンコーダーの性能が不十分なため妥協として生成内容に補正をかけるものである
優れたモデルほどCFG低め、ネガプロ少な目or無しになるのが自然

サンプラー


civitaiの解説記事

  • Euler SMEA

  • Euler SMEA Dy

  • DPM++ 2S a

  • RES Solver

  • noobの公式推奨サンプラーはeulerです。SMEAサンプラーはeulerサンプラーの(おおよそ)改善版です。
    SMEA法は画像の潜在空間を拡大し、それを元の次元に圧縮することで、可能な画像のバリエーションの範囲を増やします。欠点は引いた構図になりやすいこと。
    dynメソッドは定期的に画像の一部を抽出し、それをノイズ除去し、元の画像に戻します。

CFG++が付いているサンプラーは低CFG≒高速で画像が作れるが
CFG下げるとregional prompterとかforge coupleなどを使って複雑なプロンプトを組む時の応答度は低下します。CFGを上げるとガビガビ
シンプルなプロンプトで単純な画像を作るとき以外はあまり適していないと思います

  • STEP:25–35

  • CFG scale:4–9(7)

スケジューラー

  • Automatic

  • SGM Uniform

  • Normal

  • DDIM

  • Align Your Steps:[14.615, 6.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]

  • Align Your Steps Custom:[28.615, 11.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]?

Advanced Model Sampling for Forge

サンプリング手法を従来のものから変更する機能
最新版のReforgeでは設定不要、基本自動でサンプリング方法を変えてくれる
※たまに反応しないV-predモデルがある
色が変な時は設定してみた方が良い

EPSモデル(普通のモデルのこと)
☑Enable Advanced Model Sampling
☑Discrete or ☑Continuous EDM
☑eps
※☑Zero SNR

V-predモデル
☑Enable Advanced Model Sampling
☑Discrete
☑v_prediction
☑Zero SNR

Adetailer

yolov8x-worldv2
万能全部乗せ、Hires fixみたいな感じで使える

Forge Couple

複数描き分けや複雑なプロンプトを機能させるために使用する
使いこなせばかなり便利

Tile Direction:Horizontal→横、Vertical→上下、分割の方向を指定する

Global Effect:None、First Line、Last Line
指定した行(ない・最初・最後の行)を全体に影響するプロンプトにする
品質タグ、背景、構図やカメラなどを入れる

Region Assignment:Basicは分割数だけ
AdvancedやMASKは大まかな範囲を指定できる。実際に描画される範囲はガバガバなのでかなり大まかな目安でしかない。ガン無視されることが多いが、要素が混ざることを抑制できる。
Advancedで品質タグの行の範囲を指定する時は画面全体にする。

Couple separator:この欄に入力したプロンプト以降が次の行、分割した別の画面のプロンプトとして認識される。
デフォルトでは改行文字で認識するようになっている。
aaaとかabcなど適当な文字を使用することも可能。

Gobal Effect Weight:0.5~1

拡張機能

これだけは入れとけ系、無いとめんどくさい

a1111-sd-webui-tagcomplete

タグの入力補助をしてくれるツール
ローカルの必須機能

sd-webui-prompt-all-in-one

簡単なタグの一覧、翻訳機能、プロンプトの清書機能をひとまとめにした拡張機能
良く使うプロンプトをお気に入りにして登録などもできる

設定

User Interface / Live preview

☐Show live previews of the created image
生成途中の画像の表示
offにするとvramの消費量が減って生成速度が若干上がる

おまけ

品質lora

SPO-SDXL_4k-p_10ep_LoRA_webui

Detail Tweaker XL

Aesthetic Quality Modifiers - Masterpiece

illustriousXL/AnimagineXL4.0 Stabilizer

高速化lora

Accelerater_ILLustrious_PAseer


目次に戻る


派生モデル

プロンプトの応答性が高くモデルの知識量が豊富と思われるものだけをピックアップしています
絵柄を半分固定しているようなモデルはおすすめに挙げません

大まかに分けて3系統

  1. Illustrious系(画質の改善だけ)

  2. NoobAI系(モデルの知識が大幅に増加)

  3. RouWei系(noobにない知識を持っているが総合的には負けている)

基本はnoobai派生 > その他のillustrious派生モデルでおすすめ
出来ることの幅が一番広いので
また、高品質な画像を作りたいならV-predモデル > EPSモデル
色の表現に明確な差があります

また、noobaiのclipをそのまま使っているようなモデルか
追加学習で改善を目指しているようなモデルが基本的には優れています
noobaiが現状一番出力できる絵柄やキャラクターの種類が多いので
適当に他のモデル(ponyとか)とマージしたような派生モデルは
デフォルトの絵柄が(製作者の好みの方向性で)奇麗になっている代わりに
出来ること滅茶苦茶減っています
描き分けが苦手になり、人間以外の物の知識は本家noob成分が薄れるほど弱くなってまともに出なくなります

複雑なプロンプト適正(超主観的)
NOOB系(特にv-predモデル) > Illustrious1.0系 > animagine4.0系 > pony系
品質の安定性
Illustrious1.0系 > NOOB系 > animagine4.0系 > pony系

Q. で、結局一番おすすめのモデルは何?
A. NoobAI-XL V-Pred


目次に戻る


EPSモデル

いわゆる普通のモデル
順番は割と適当
人体の崩れにくさとか品質ではなく癖のなさやプロンプトの応答度が高いと思った順
①と②の違いの方が順番より大きい
①は本家で出るものはほぼ全部出る(はず)
②は①とそんなに変わらないけど一部がちょっと怪しい

EPSモデル早見表

本家Noob
NoobAI-XL Epsilon-pred
①本家に近いモデル
NNGMIX(v1.0) ≧  NNAillous-xl ≧ 
Mol_Keun Mix ≧ NewGrounds Mix ≧ Life Orb XL ≧ 
WHATnoobie ≧ AnyNoobAI ≧ PaSanctuary ≧ 
NTR MIX ≧ i5-xl ≧ personal merge ≧ 
Perpendicular-Cyberfix-V2 (EPS)
②絵柄が多少調整されているモデル
Raehoshi ≧ NoobaHoshicoco-IllustriousSweet-mixNova Orange XL ≧ Obsession ≧ Noob Merge
その他
RouWei


NoobAI-XL Epsilon-pred

1.1以降画質が大幅に向上
指定なしのデフォルトの絵柄でも結構奇麗に出るようになった
指や人体などの表現も別に下手ではないし表情などの多様性は本家が恐らく一番強い
キャラクター知識も本家が一番正確で塗りとかまでかなり再現しているのは本家noobぐらい


①本家に近いモデル

NNGMIX

lora向けのモデル
品質が若干改善
v1.0が一番本家に近く絵柄も近いものが出る
純粋な本家の改良?

NNAillous

NTR MIXの派生
NTR MIXよりもモデルの知識が正確で扱いやすい

Mol_Keun Mix

細部が崩れにくくプロンプトの応答度も地味に本家並みに高く使いやすい
デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられる
欠点は等身低めになりやすい事

NewGrounds Mix

デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられるので使いやすい
mol keunに似てる

Life Orb XL

絵柄指定なしでも高品質な画像が作れるように調整されたモデル
ポン出しでもかなりきれいな絵が出る

WHATnoobie

AnyNoobAI

loraトレーニング用
普通に使用することには不向きという説明だがv-pred版は確かにそうだがeps版はそうでもない
画風を平均値に近づけ多様性が高まるように調整されている

PaSanctuary

追加学習でリアル調の出力も強化したモデル
本家の絵柄も普通に出る

NTR MIX

光の反射エフェクトや質感のある塗りが得意なlora向けのモデル
使用するなら777以降がおすすめでそれ以前はnoobの絵の知識が結構消えている
順当に後のモデルほど良くなっていて新しいものは絵柄の知識が本家とほぼ同じぐらい
欠点は奇麗なものが出やすい一方で光エフェクトや細かい背景をモデルが入れたがるせいで逆に一部の表現が苦手になっていること

i5-xl

illustiousにNNAillousやNTRMIXを混ぜたillustriousとnoobの中間みたいなモデル
人体描写が比較的安定している
欠点は色の表現が若干弱いこと

personal merge

noobベースの複数のモデルを混ぜていいとこどりを目指したモデル

Perpendicular-Cyberfix-V2 (EPS)

clipはそのままでモデルのベースをSDXLからそれを改良したCyberRealisticに差し替えたモデル
人体描写が若干改善する
色の表現は本家より苦手

PornMaster-Anime

https://civitai.com/models/1033851/pornmaster-anime-illustrious-noob?modelVersionId=1188818


②絵柄が多少調整されているモデル

Raehoshi

追加学習で出力できるキャラ数がNooAI EPS1.1からさらに増えている
デフォルトの絵柄の影響が若干ある
人体描写も強めで出来ることが多いので使いやすい

NoobaHoshi

raehoshiとnova orangeを混ぜたモデル
一部のプロンプトがraehoshiよりも応答性が良くなっている
欠点はraehoshiで増えた知識が一部弱くなっていること

coco-Illustrious

人体描写がかなり安定している
絵柄の多様さが若干犠牲になっているのが欠点

Sweet-mix


Nova Orange XL

鮮明で彩度が高い

Obsession

構図が元より多彩なものが出やすい印象

NoobMerge

本家とObsessionの中間みたいなモデル
鮮明な画像を作りやすい
欠点はフラットな絵柄になりがちなこと


その他

RouWei

Noobとは別系統のillustriousの大規模追加学習モデル
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手


目次に戻る


V-pred モデル

プロンプトの応答度が高いと思った順

従来のSDXLモデル、epsilon(eps)は画像のノイズ部分を予測、
v-prediction(v-pred)はノイズ除去前と除去後の差分を予測する。
数値の安定性の改善や収束速度の改善があるらしい。また、Zero Terminal SNRを併用することで色の応答性の問題を修正する。
従来の方法は画像をノイズに変換して学習する過程でデータにロスが発生する欠陥があった。その欠点を克服するための学習手法。
また、学習時のデータのロスが指が6本になったり細かい部分が苦手な生成AIの特徴につながっているのではないか?と言われてもいる

詳しくは以下の記事


v-predモデルに使われているZSNRはmergeでデータが損なわれる
そのため適当に複数のモデルを混ぜて派生のv-predモデルを作ることが難しい
ある程度ちゃんと知識のある人しかモデルを作っていないのでモデルの総数が少ないが出来の悪いものも少ない

V-Predモデル早見表

NoobAI-XL V-Pred ≒ un-phony ≧ noobmod > 
WAI-SHUFFLE-NOOB ≧ susamixEX ≧ 
NAI-XL vpred1.0 2d accelerated ≧ ΣΙΗ ≧ ch_V_Pred > 
Blu's salty finetuned mixHikari Noob v-predAbydos-Noob
Koronemixcopycat-noobCat Tower ≧ 
Perpendicular-Cyberfix-V2
その他
RouWei v-pred

NoobAI-XL V-Pred

まともに使いこなせる人が少ないが突きつめれば結局このモデルが最強だと思う
プロンプトの応答度が他のモデルとかなり違う
色の表現が優れていて基本派生モデルよりも本家の方が奇麗
彩度が過度になりやすいので低めのCFGを推奨する人が多いが
CFGを下げるとプロンプトの応答度が低下して複雑なプロンプトを書くときに支障がでるので基本7ぐらいの方が良いと思います

un-phony

追加学習で背景描写が強化されている
プロンプト読解力が高く恐らく本家と同等
漫画的表現が本家よりも強い
AとBがあるが個人的にはBの方がおすすめ
reforgeがv-predモデルと認識してくれないので手動でAdvanced Model Sampling for Forgeを設定する必要がある

noobmod

複数のモデルから良いとこ取りしたv-pred版のpersonal merge
人体描写強めで細部が崩れにくい
純粋な画質ならトップ

WAI-SHUFFLE-NOOB v-pred

一部以外の絵柄は本家に近い
個人的には同じ作者のモデルではnoobベースのv-predモデルが一番出来がいいと思う

susamixEX

アニメ塗りに寄せている

NAI-XL vpred1.0 2d accelerated

本家から彩度が若干控えめになったモデル
モノクロ気味になりやすいのが欠点

ΣΙΗ

noobベースの複数のモデルを混ぜていいとこどりを目指したモデル

ch_V_Pred

本家よりタッチが漫画絵寄り
人体描写がちょっと弱い

Blu's salty finetuned mix

※現在ダウンロード不可
プロンプトへの反応は本家とほぼ同じ
本家よりくっきりした絵が出る
それがメリットにもデメリットにもなる

Hikari Noob v-pred

susamixEXとNoob V-predの中間みたいな使い勝手
カメラプロンプトの本家のピーキーさが若干マイルドになっている

Abydos-Noob


Koronemix Vpred

ネガプロなしでも奇麗に出る
欠点は全体的に色が弱い

copycat-noob v-pred

ネガプロなしでも奇麗に出る

Cat Tower v-pred

細部が安定しているので本家よりも複数出力が得意な面がある
色や絵柄は本家に若干劣る

Perpendicular-Cyberfix-V2

コントラストが本家より若干マイルドに
cyberfixのメソッドでmergeしたモデルはプロンプトの読解力はそのままで人体描写が若干改善という触れ込みだがそこらへんはあんまり変化を感じない
多分元の性能も別に悪くないせい

その他

RouWei v-pred

EPSモデルよりこっちの方が出来がいい
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手



いいなと思ったら応援しよう!