Illustriousおすすめモデル

robai104

2024年10月3日 19:58

随時更新
ほぼNoobAIモデル紹介
ローカル環境でアニメ調のイラストを出すなら現状一強のモデル
リアル調はFLUX使えばいいじゃんと思ってるのでそっち系のモデルは入れてません

Illustrious-XL

環境

使用するPCはGPUのVRAM12GB以上
メモリ32GB以上推奨

簡単導入はここから

画像のサイズ

1024x1024
1152x896
1216x832
1344x768
1536x640

プロンプト

ポジティブプロンプト

illustrious0.1
masterpiece, best quality, good quality, newest

masterpiece > best quality > good quality > average quality > bad quality > worst quality

NoobAI
masterpiece,very awa,~~best quality~~

品質タグ
masterpiece > best quality > good quality > normal quality > worst quality

美的タグ
very awa >>> worst aesthetic

解像度
incredibly absurdres(over 10000) >
absurdres(3200×2400) >
highres(1600×1200) >
lowres(500×500)
SDXLの場合highresの解像度が最適な気がする
生成するサイズに合わせてある程度変えてもいいかも？

detailed
描き込み量を増やす、ultra detailedはより強い効果があるがマイナスに働くこともある

strong rimlight / Volumetric Lighting
陰影や光の反射などが追加され質感が上がる
ライトそのものが出ちゃうこともある

年代
oldest(~2017年)、old(~2019年)、modern(~2020年)、recent(~2022年)、newest(~2023年)

レーティング
general→sensitive→questionable→explicit

複数の人数表記

複雑なプロンプトを書く際のコツ？

CFGを高めにする
プロンプトの影響範囲が広いものから順番に記述する
画面の上から順に記述する
複数を出力する場合、メインで描く主役を決める
大まかな輪郭・全体像を決定するプロンプト→それを修飾するプロンプトの順で記述する
カメラと人数指定のプロンプトは性質が似ていて画面全体への影響がとても強いので使用は最低限にすること

※構図・カメラ？
↓
共通の動作
↓
人数
↓
boy+説明文・girl+説明文
↓
周囲の環境や風景
↓
画風→品質→年代→レーティング
↓
※構図・カメラ？

隣接するプロンプト同士はカンマで区切っても互いに影響を受ける
noobは自然言語でも学習しているので通常のタグのプロンプト同士も短いものであれば混ぜて認識させることができる

複数出力

illustriousベースのモデルは2～3人までの複数出力で
影響範囲の狭い短いプロンプト（表情など）を個別にプロンプトの記述のみで指定することが出来る
ただし色々と制限がありどこまでできるかは何をするかによって変わる
詳細にたくさん書けるのは一人の人物だけ
主役と複数の脇役になる
それ以外は表情などの影響範囲が狭いもののみ、タグも一つか二つしか使えない
また、アクション＋anotherと書くことで他人への行動として指定できたりできなかったりする

ネガティブプロンプト

illustrious0.1

lowres,(worst quality, bad quality:1.2),bad anatomy,sketch,jpeg artifacts,signature,watermark,old,oldest,

NoobAI

worst quality,worst aesthetic,poorly drawn,source filmmaker (medium),~~low quality~~,

worst aesthetic,worst qualityが特に効果的
ネガプロは盛り過ぎるとプロンプトの応答度が低下する
可能な限り限り減らした方が良い
そもそもネガティブプロンプトはモデルのテキストエンコーダーの性能が不十分なため妥協として生成内容に補正をかけるものである
優れたモデルほどCFG低め、ネガプロ少な目or無しになるのが自然

サンプラー

civitaiの解説記事

Euler SMEA
Euler SMEA Dy
DPM++ 2S a
RES Solver
noobの公式推奨サンプラーはeulerです。SMEAサンプラーはeulerサンプラーの（おおよそ）改善版です。
SMEA法は画像の潜在空間を拡大し、それを元の次元に圧縮することで、可能な画像のバリエーションの範囲を増やします。欠点は引いた構図になりやすいこと。
dynメソッドは定期的に画像の一部を抽出し、それをノイズ除去し、元の画像に戻します。

CFG＋＋が付いているサンプラーは低CFG≒高速で画像が作れるが
CFG下げるとregional prompterとかforge coupleなどを使って複雑なプロンプトを組む時の応答度は低下します。CFGを上げるとガビガビ
シンプルなプロンプトで単純な画像を作るとき以外はあまり適していないと思います

STEP：25–35
CFG scale：4–9（7）

スケジューラー

Automatic
SGM Uniform
Normal
DDIM
Align Your Steps：[14.615, 6.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]
Align Your Steps Custom：[28.615, 11.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]？

Advanced Model Sampling for Forge

サンプリング手法を従来のものから変更する機能
最新版のReforgeでは設定不要、基本自動でサンプリング方法を変えてくれる
※たまに反応しないV-predモデルがある
色が変な時は設定してみた方が良い

EPSモデル(普通のモデルのこと)
☑Enable Advanced Model Sampling
☑Discrete or ☑Continuous EDM
☑eps
※☑Zero SNR

V-predモデル
☑Enable Advanced Model Sampling
☑Discrete
☑v_prediction
☑Zero SNR

Adetailer

yolov8x-worldv2
万能全部乗せ、Hires fixみたいな感じで使える

Forge Couple

複数描き分けや複雑なプロンプトを機能させるために使用する
使いこなせばかなり便利

Tile Direction：Horizontal→横、Vertical→上下、分割の方向を指定する

Global Effect：None、First Line、Last Line
指定した行(ない・最初・最後の行)を全体に影響するプロンプトにする
品質タグ、背景、構図やカメラなどを入れる

Region Assignment：Basicは分割数だけ
AdvancedやMASKは大まかな範囲を指定できる。実際に描画される範囲はガバガバなのでかなり大まかな目安でしかない。ガン無視されることが多いが、要素が混ざることを抑制できる。
Advancedで品質タグの行の範囲を指定する時は画面全体にする。

Couple separator：この欄に入力したプロンプト以降が次の行、分割した別の画面のプロンプトとして認識される。
デフォルトでは改行文字で認識するようになっている。
aaaとかabcなど適当な文字を使用することも可能。

Gobal Effect Weight:0.5~１

拡張機能

これだけは入れとけ系、無いとめんどくさい

a1111-sd-webui-tagcomplete

タグの入力補助をしてくれるツール
ローカルの必須機能

sd-webui-prompt-all-in-one

簡単なタグの一覧、翻訳機能、プロンプトの清書機能をひとまとめにした拡張機能
良く使うプロンプトをお気に入りにして登録などもできる

設定

User Interface / Live preview

☐Show live previews of the created image
生成途中の画像の表示
offにするとvramの消費量が減って生成速度が若干上がる

おまけ

品質lora

SPO-SDXL_4k-p_10ep_LoRA_webui

Detail Tweaker XL

Aesthetic Quality Modifiers - Masterpiece

illustriousXL/AnimagineXL4.0 Stabilizer

高速化lora

Accelerater_ILLustrious_PAseer

目次に戻る

派生モデル

プロンプトの応答性が高くモデルの知識量が豊富と思われるものだけをピックアップしています
絵柄を半分固定しているようなモデルはおすすめに挙げません

大まかに分けて3系統

Illustrious系(画質の改善だけ)
NoobAI系(モデルの知識が大幅に増加)
RouWei系(noobにない知識を持っているが総合的には負けている)

基本はnoobai派生 > その他のillustrious派生モデルでおすすめ
出来ることの幅が一番広いので
また、高品質な画像を作りたいならV-predモデル > EPSモデル
色の表現に明確な差があります

また、noobaiのclipをそのまま使っているようなモデルか
追加学習で改善を目指しているようなモデルが基本的には優れています
noobaiが現状一番出力できる絵柄やキャラクターの種類が多いので
適当に他のモデル(ponyとか)とマージしたような派生モデルは
デフォルトの絵柄が(製作者の好みの方向性で)奇麗になっている代わりに
出来ること滅茶苦茶減っています
描き分けが苦手になり、人間以外の物の知識は本家noob成分が薄れるほど弱くなってまともに出なくなります

複雑なプロンプト適正(超主観的)
NOOB系(特にv-predモデル) > Illustrious1.0系 > animagine4.0系 > pony系
品質の安定性
Illustrious1.0系 > NOOB系 > animagine4.0系 > pony系

Q. で、結局一番おすすめのモデルは何？
A. NoobAI-XL V-Pred

目次に戻る

EPSモデル

いわゆる普通のモデル
順番は割と適当
人体の崩れにくさとか品質ではなく癖のなさやプロンプトの応答度が高いと思った順
①と②の違いの方が順番より大きい
①は本家で出るものはほぼ全部出る(はず)
②は①とそんなに変わらないけど一部がちょっと怪しい

EPSモデル早見表

本家Noob
NoobAI-XL Epsilon-pred
①本家に近いモデル
NNGMIX(v1.0) ≧ NNAillous-xl ≧
Mol_Keun Mix ≧ NewGrounds Mix ≧ Life Orb XL ≧
WHATnoobie ≧ AnyNoobAI ≧ PaSanctuary ≧
NTR MIX ≧ i5-xl ≧ personal merge ≧
Perpendicular-Cyberfix-V2 (EPS)
②絵柄が多少調整されているモデル
Raehoshi ≧ NoobaHoshi ≧ coco-Illustrious ≧ Sweet-mix ≧ Nova Orange XL ≧ Obsession ≧ Noob Merge
その他
RouWei

NoobAI-XL Epsilon-pred

1.1以降画質が大幅に向上
指定なしのデフォルトの絵柄でも結構奇麗に出るようになった
指や人体などの表現も別に下手ではないし表情などの多様性は本家が恐らく一番強い
キャラクター知識も本家が一番正確で塗りとかまでかなり再現しているのは本家noobぐらい

①本家に近いモデル

NNGMIX

lora向けのモデル
品質が若干改善
v1.0が一番本家に近く絵柄も近いものが出る
純粋な本家の改良？

NNAillous

NTR MIXの派生
NTR MIXよりもモデルの知識が正確で扱いやすい

Mol_Keun Mix

細部が崩れにくくプロンプトの応答度も地味に本家並みに高く使いやすい
デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられる
欠点は等身低めになりやすい事

NewGrounds Mix

デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられるので使いやすい
mol keunに似てる

Life Orb XL

絵柄指定なしでも高品質な画像が作れるように調整されたモデル
ポン出しでもかなりきれいな絵が出る

WHATnoobie

AnyNoobAI

loraトレーニング用
普通に使用することには不向きという説明だがv-pred版は確かにそうだがeps版はそうでもない
画風を平均値に近づけ多様性が高まるように調整されている

PaSanctuary

追加学習でリアル調の出力も強化したモデル
本家の絵柄も普通に出る

NTR MIX

光の反射エフェクトや質感のある塗りが得意なlora向けのモデル
使用するなら777以降がおすすめでそれ以前はnoobの絵の知識が結構消えている
順当に後のモデルほど良くなっていて新しいものは絵柄の知識が本家とほぼ同じぐらい
欠点は奇麗なものが出やすい一方で光エフェクトや細かい背景をモデルが入れたがるせいで逆に一部の表現が苦手になっていること

i5-xl

illustiousにNNAillousやNTRMIXを混ぜたillustriousとnoobの中間みたいなモデル
人体描写が比較的安定している
欠点は色の表現が若干弱いこと

personal merge

noobベースの複数のモデルを混ぜていいとこどりを目指したモデル

Perpendicular-Cyberfix-V2 (EPS)

clipはそのままでモデルのベースをSDXLからそれを改良したCyberRealisticに差し替えたモデル
人体描写が若干改善する
色の表現は本家より苦手

~~PornMaster-Anime~~

~~https://civitai.com/models/1033851/pornmaster-anime-illustrious-noob?modelVersionId=1188818~~

②絵柄が多少調整されているモデル

Raehoshi

追加学習で出力できるキャラ数がNooAI EPS1.1からさらに増えている
デフォルトの絵柄の影響が若干ある
人体描写も強めで出来ることが多いので使いやすい

NoobaHoshi

raehoshiとnova orangeを混ぜたモデル
一部のプロンプトがraehoshiよりも応答性が良くなっている
欠点はraehoshiで増えた知識が一部弱くなっていること

coco-Illustrious

人体描写がかなり安定している
絵柄の多様さが若干犠牲になっているのが欠点

Sweet-mix

Nova Orange XL

鮮明で彩度が高い

Obsession

構図が元より多彩なものが出やすい印象

NoobMerge

本家とObsessionの中間みたいなモデル
鮮明な画像を作りやすい
欠点はフラットな絵柄になりがちなこと

その他

RouWei

Noobとは別系統のillustriousの大規模追加学習モデル
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手

目次に戻る

V-pred モデル

プロンプトの応答度が高いと思った順

従来のSDXLモデル、epsilon(eps)は画像のノイズ部分を予測、
v-prediction(v-pred)はノイズ除去前と除去後の差分を予測する。
数値の安定性の改善や収束速度の改善があるらしい。また、Zero Terminal SNRを併用することで色の応答性の問題を修正する。
従来の方法は画像をノイズに変換して学習する過程でデータにロスが発生する欠陥があった。その欠点を克服するための学習手法。
また、学習時のデータのロスが指が6本になったり細かい部分が苦手な生成AIの特徴につながっているのではないか？と言われてもいる

詳しくは以下の記事

v-predモデルに使われているZSNRはmergeでデータが損なわれる
そのため適当に複数のモデルを混ぜて派生のv-predモデルを作ることが難しい
ある程度ちゃんと知識のある人しかモデルを作っていないのでモデルの総数が少ないが出来の悪いものも少ない

V-Predモデル早見表

NoobAI-XL V-Pred ≒ un-phony ≧ noobmod >
WAI-SHUFFLE-NOOB ≧ susamixEX ≧
NAI-XL vpred1.0 2d accelerated ≧ ΣΙΗ ≧ ch_V_Pred >
Blu's salty finetuned mix > Hikari Noob v-pred ≧ Abydos-Noob >
Koronemix ≧ copycat-noob ≧ Cat Tower ≧
Perpendicular-Cyberfix-V2
その他
RouWei v-pred

その他

RouWei v-pred

EPSモデルよりこっちの方が出来がいい
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手

Illustriousおすすめモデル

目次

環境

画像のサイズ

プロンプト

ポジティブプロンプト

複数出力

ネガティブプロンプト

サンプラー

スケジューラー

Advanced Model Sampling for Forge

Adetailer

Forge Couple

拡張機能

設定

User Interface / Live preview

おまけ

品質lora

高速化lora

派生モデル

EPSモデル早見表

①本家に近いモデル

②絵柄が多少調整されているモデル

V-pred モデル

V-Predモデル早見表

その他

RouWei v-pred

いいなと思ったら応援しよう！