![見出し画像](https://assets.st-note.com/production/uploads/images/174829682/rectangle_large_type_2_4e964ebdbd39ae5fa12c33250c593b6b.png?width=1200)
Illustriousおすすめモデル
随時更新
ほぼNoobAIモデル紹介
ローカル環境でアニメ調のイラストを出すなら現状一強のモデル
リアル調はFLUX使えばいいじゃんと思ってるのでそっち系のモデルは入れてません
目次
Illustrious-XL
環境
使用するPCはGPUのVRAM12GB以上
メモリ32GB以上推奨
簡単導入はここから
画像のサイズ
1024x1024
1152x896
1216x832
1344x768
1536x640
プロンプト
ポジティブプロンプト
illustrious0.1
masterpiece, best quality, good quality, newest
masterpiece > best quality > good quality > average quality > bad quality > worst quality
NoobAI
masterpiece,very awa,best quality
品質タグ
masterpiece > best quality > good quality > normal quality > worst quality
美的タグ
very awa >>> worst aesthetic
解像度
incredibly absurdres(over 10000) >
absurdres(3200×2400) >
highres(1600×1200) >
lowres(500×500)
SDXLの場合highresの解像度が最適な気がする
生成するサイズに合わせてある程度変えてもいいかも?
detailed
描き込み量を増やす、ultra detailedはより強い効果があるがマイナスに働くこともある
strong rimlight / Volumetric Lighting
陰影や光の反射などが追加され質感が上がる
ライトそのものが出ちゃうこともある
年代
oldest(~2017年)、old(~2019年)、modern(~2020年)、recent(~2022年)、newest(~2023年)
レーティング
general→sensitive→questionable→explicit
複数の人数表記
複雑なプロンプトを書く際のコツ?
CFGを高めにする
プロンプトの影響範囲が広いものから順番に記述する
画面の上から順に記述する
複数を出力する場合、メインで描く主役を決める
大まかな輪郭・全体像を決定するプロンプト→それを修飾するプロンプトの順で記述する
カメラと人数指定のプロンプトは性質が似ていて画面全体への影響がとても強いので使用は最低限にすること
※構図・カメラ?
↓
共通の動作
↓
人数
↓
boy+説明文・girl+説明文
↓
周囲の環境や風景
↓
画風→品質→年代→レーティング
↓
※構図・カメラ?
隣接するプロンプト同士はカンマで区切っても互いに影響を受ける
noobは自然言語でも学習しているので通常のタグのプロンプト同士も短いものであれば混ぜて認識させることができる
複数出力
illustriousベースのモデルは2~3人までの複数出力で
影響範囲の狭い短いプロンプト(表情など)を個別にプロンプトの記述のみで指定することが出来る
ただし色々と制限がありどこまでできるかは何をするかによって変わる
詳細にたくさん書けるのは一人の人物だけ
主役と複数の脇役になる
それ以外は表情などの影響範囲が狭いもののみ、タグも一つか二つしか使えない
また、アクション+anotherと書くことで他人への行動として指定できたりできなかったりする
ネガティブプロンプト
illustrious0.1
lowres,(worst quality, bad quality:1.2),bad anatomy,sketch,jpeg artifacts,signature,watermark,old,oldest,
NoobAI
worst quality,worst aesthetic,poorly drawn,source filmmaker (medium),low quality,
worst aesthetic,worst qualityが特に効果的
ネガプロは盛り過ぎるとプロンプトの応答度が低下する
可能な限り限り減らした方が良い
そもそもネガティブプロンプトはモデルのテキストエンコーダーの性能が不十分なため妥協として生成内容に補正をかけるものである
優れたモデルほどCFG低め、ネガプロ少な目or無しになるのが自然
サンプラー
civitaiの解説記事
Euler SMEA
Euler SMEA Dy
DPM++ 2S a
RES Solver
noobの公式推奨サンプラーはeulerです。SMEAサンプラーはeulerサンプラーの(おおよそ)改善版です。
SMEA法は画像の潜在空間を拡大し、それを元の次元に圧縮することで、可能な画像のバリエーションの範囲を増やします。欠点は引いた構図になりやすいこと。
dynメソッドは定期的に画像の一部を抽出し、それをノイズ除去し、元の画像に戻します。
CFG++が付いているサンプラーは低CFG≒高速で画像が作れるが
CFG下げるとregional prompterとかforge coupleなどを使って複雑なプロンプトを組む時の応答度は低下します。CFGを上げるとガビガビ
シンプルなプロンプトで単純な画像を作るとき以外はあまり適していないと思います
STEP:25–35
CFG scale:4–9(7)
スケジューラー
Automatic
SGM Uniform
Normal
DDIM
Align Your Steps:[14.615, 6.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]
Align Your Steps Custom:[28.615, 11.315, 3.771, 2.181, 1.342, 0.862, 0.555, 0.380, 0.234, 0.113, 0.029]?
Advanced Model Sampling for Forge
サンプリング手法を従来のものから変更する機能
最新版のReforgeでは設定不要、基本自動でサンプリング方法を変えてくれる
※たまに反応しないV-predモデルがある
色が変な時は設定してみた方が良い
EPSモデル(普通のモデルのこと)
☑Enable Advanced Model Sampling
☑Discrete or ☑Continuous EDM
☑eps
※☑Zero SNR
V-predモデル
☑Enable Advanced Model Sampling
☑Discrete
☑v_prediction
☑Zero SNR
Adetailer
yolov8x-worldv2
万能全部乗せ、Hires fixみたいな感じで使える
Forge Couple
複数描き分けや複雑なプロンプトを機能させるために使用する
使いこなせばかなり便利
Tile Direction:Horizontal→横、Vertical→上下、分割の方向を指定する
Global Effect:None、First Line、Last Line
指定した行(ない・最初・最後の行)を全体に影響するプロンプトにする
品質タグ、背景、構図やカメラなどを入れる
Region Assignment:Basicは分割数だけ
AdvancedやMASKは大まかな範囲を指定できる。実際に描画される範囲はガバガバなのでかなり大まかな目安でしかない。ガン無視されることが多いが、要素が混ざることを抑制できる。
Advancedで品質タグの行の範囲を指定する時は画面全体にする。
Couple separator:この欄に入力したプロンプト以降が次の行、分割した別の画面のプロンプトとして認識される。
デフォルトでは改行文字で認識するようになっている。
aaaとかabcなど適当な文字を使用することも可能。
Gobal Effect Weight:0.5~1
拡張機能
これだけは入れとけ系、無いとめんどくさい
a1111-sd-webui-tagcomplete
タグの入力補助をしてくれるツール
ローカルの必須機能
sd-webui-prompt-all-in-one
簡単なタグの一覧、翻訳機能、プロンプトの清書機能をひとまとめにした拡張機能
良く使うプロンプトをお気に入りにして登録などもできる
設定
User Interface / Live preview
☐Show live previews of the created image
生成途中の画像の表示
offにするとvramの消費量が減って生成速度が若干上がる
おまけ
品質lora
Aesthetic Quality Modifiers - Masterpiece
illustriousXL/AnimagineXL4.0 Stabilizer
高速化lora
Accelerater_ILLustrious_PAseer
派生モデル
プロンプトの応答性が高くモデルの知識量が豊富と思われるものだけをピックアップしています
絵柄を半分固定しているようなモデルはおすすめに挙げません
大まかに分けて3系統
Illustrious系(画質の改善だけ)
NoobAI系(モデルの知識が大幅に増加)
RouWei系(noobにない知識を持っているが総合的には負けている)
基本はnoobai派生 > その他のillustrious派生モデルでおすすめ
出来ることの幅が一番広いので
また、高品質な画像を作りたいならV-predモデル > EPSモデル
色の表現に明確な差があります
また、noobaiのclipをそのまま使っているようなモデルか
追加学習で改善を目指しているようなモデルが基本的には優れています
noobaiが現状一番出力できる絵柄やキャラクターの種類が多いので
適当に他のモデル(ponyとか)とマージしたような派生モデルは
デフォルトの絵柄が(製作者の好みの方向性で)奇麗になっている代わりに
出来ること滅茶苦茶減っています
描き分けが苦手になり、人間以外の物の知識は本家noob成分が薄れるほど弱くなってまともに出なくなります
複雑なプロンプト適正(超主観的)
NOOB系(特にv-predモデル) > Illustrious1.0系 > animagine4.0系 > pony系
品質の安定性
Illustrious1.0系 > NOOB系 > animagine4.0系 > pony系
Q. で、結局一番おすすめのモデルは何?
A. NoobAI-XL V-Pred
EPSモデル
いわゆる普通のモデル
順番は割と適当
人体の崩れにくさとか品質ではなく癖のなさやプロンプトの応答度が高いと思った順
①と②の違いの方が順番より大きい
①は本家で出るものはほぼ全部出る(はず)
②は①とそんなに変わらないけど一部がちょっと怪しい
EPSモデル早見表
本家Noob
NoobAI-XL Epsilon-pred
①本家に近いモデル
NNGMIX(v1.0) ≧ NNAillous-xl ≧
Mol_Keun Mix ≧ NewGrounds Mix ≧ Life Orb XL ≧
WHATnoobie ≧ AnyNoobAI ≧ PaSanctuary ≧
NTR MIX ≧ i5-xl ≧ personal merge ≧
Perpendicular-Cyberfix-V2 (EPS)
②絵柄が多少調整されているモデル
Raehoshi ≧ NoobaHoshi ≧ coco-Illustrious ≧ Sweet-mix ≧ Nova Orange XL ≧ Obsession ≧ Noob Merge
その他
RouWei
NoobAI-XL Epsilon-pred
1.1以降画質が大幅に向上
指定なしのデフォルトの絵柄でも結構奇麗に出るようになった
指や人体などの表現も別に下手ではないし表情などの多様性は本家が恐らく一番強い
キャラクター知識も本家が一番正確で塗りとかまでかなり再現しているのは本家noobぐらい
①本家に近いモデル
NNGMIX
lora向けのモデル
品質が若干改善
v1.0が一番本家に近く絵柄も近いものが出る
純粋な本家の改良?
NNAillous
NTR MIXの派生
NTR MIXよりもモデルの知識が正確で扱いやすい
Mol_Keun Mix
細部が崩れにくくプロンプトの応答度も地味に本家並みに高く使いやすい
デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられる
欠点は等身低めになりやすい事
NewGrounds Mix
デフォルトの絵柄があるが本家の知識も損なわれていなくて変えられるので使いやすい
mol keunに似てる
Life Orb XL
絵柄指定なしでも高品質な画像が作れるように調整されたモデル
ポン出しでもかなりきれいな絵が出る
WHATnoobie
AnyNoobAI
loraトレーニング用
普通に使用することには不向きという説明だがv-pred版は確かにそうだがeps版はそうでもない
画風を平均値に近づけ多様性が高まるように調整されている
PaSanctuary
追加学習でリアル調の出力も強化したモデル
本家の絵柄も普通に出る
NTR MIX
光の反射エフェクトや質感のある塗りが得意なlora向けのモデル
使用するなら777以降がおすすめでそれ以前はnoobの絵の知識が結構消えている
順当に後のモデルほど良くなっていて新しいものは絵柄の知識が本家とほぼ同じぐらい
欠点は奇麗なものが出やすい一方で光エフェクトや細かい背景をモデルが入れたがるせいで逆に一部の表現が苦手になっていること
i5-xl
illustiousにNNAillousやNTRMIXを混ぜたillustriousとnoobの中間みたいなモデル
人体描写が比較的安定している
欠点は色の表現が若干弱いこと
personal merge
noobベースの複数のモデルを混ぜていいとこどりを目指したモデル
Perpendicular-Cyberfix-V2 (EPS)
clipはそのままでモデルのベースをSDXLからそれを改良したCyberRealisticに差し替えたモデル
人体描写が若干改善する
色の表現は本家より苦手
PornMaster-Anime
https://civitai.com/models/1033851/pornmaster-anime-illustrious-noob?modelVersionId=1188818
②絵柄が多少調整されているモデル
Raehoshi
追加学習で出力できるキャラ数がNooAI EPS1.1からさらに増えている
デフォルトの絵柄の影響が若干ある
人体描写も強めで出来ることが多いので使いやすい
NoobaHoshi
raehoshiとnova orangeを混ぜたモデル
一部のプロンプトがraehoshiよりも応答性が良くなっている
欠点はraehoshiで増えた知識が一部弱くなっていること
coco-Illustrious
人体描写がかなり安定している
絵柄の多様さが若干犠牲になっているのが欠点
Sweet-mix
Nova Orange XL
鮮明で彩度が高い
Obsession
構図が元より多彩なものが出やすい印象
NoobMerge
本家とObsessionの中間みたいなモデル
鮮明な画像を作りやすい
欠点はフラットな絵柄になりがちなこと
その他
RouWei
Noobとは別系統のillustriousの大規模追加学習モデル
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手
V-pred モデル
プロンプトの応答度が高いと思った順
従来のSDXLモデル、epsilon(eps)は画像のノイズ部分を予測、
v-prediction(v-pred)はノイズ除去前と除去後の差分を予測する。
数値の安定性の改善や収束速度の改善があるらしい。また、Zero Terminal SNRを併用することで色の応答性の問題を修正する。
従来の方法は画像をノイズに変換して学習する過程でデータにロスが発生する欠陥があった。その欠点を克服するための学習手法。
また、学習時のデータのロスが指が6本になったり細かい部分が苦手な生成AIの特徴につながっているのではないか?と言われてもいる
詳しくは以下の記事
v-predモデルに使われているZSNRはmergeでデータが損なわれる
そのため適当に複数のモデルを混ぜて派生のv-predモデルを作ることが難しい
ある程度ちゃんと知識のある人しかモデルを作っていないのでモデルの総数が少ないが出来の悪いものも少ない
V-Predモデル早見表
NoobAI-XL V-Pred ≒ un-phony ≧ noobmod >
WAI-SHUFFLE-NOOB ≧ susamixEX ≧
NAI-XL vpred1.0 2d accelerated ≧ ΣΙΗ ≧ ch_V_Pred >
Blu's salty finetuned mix > Hikari Noob v-pred ≧ Abydos-Noob >
Koronemix ≧ copycat-noob ≧ Cat Tower ≧
Perpendicular-Cyberfix-V2
その他
RouWei v-pred
NoobAI-XL V-Pred
まともに使いこなせる人が少ないが突きつめれば結局このモデルが最強だと思う
プロンプトの応答度が他のモデルとかなり違う
色の表現が優れていて基本派生モデルよりも本家の方が奇麗
彩度が過度になりやすいので低めのCFGを推奨する人が多いが
CFGを下げるとプロンプトの応答度が低下して複雑なプロンプトを書くときに支障がでるので基本7ぐらいの方が良いと思います
un-phony
追加学習で背景描写が強化されている
プロンプト読解力が高く恐らく本家と同等
漫画的表現が本家よりも強い
AとBがあるが個人的にはBの方がおすすめ
reforgeがv-predモデルと認識してくれないので手動でAdvanced Model Sampling for Forgeを設定する必要がある
noobmod
複数のモデルから良いとこ取りしたv-pred版のpersonal merge
人体描写強めで細部が崩れにくい
純粋な画質ならトップ
WAI-SHUFFLE-NOOB v-pred
一部以外の絵柄は本家に近い
個人的には同じ作者のモデルではnoobベースのv-predモデルが一番出来がいいと思う
susamixEX
アニメ塗りに寄せている
NAI-XL vpred1.0 2d accelerated
本家から彩度が若干控えめになったモデル
モノクロ気味になりやすいのが欠点
ΣΙΗ
noobベースの複数のモデルを混ぜていいとこどりを目指したモデル
ch_V_Pred
本家よりタッチが漫画絵寄り
人体描写がちょっと弱い
Blu's salty finetuned mix
※現在ダウンロード不可
プロンプトへの反応は本家とほぼ同じ
本家よりくっきりした絵が出る
それがメリットにもデメリットにもなる
Hikari Noob v-pred
susamixEXとNoob V-predの中間みたいな使い勝手
カメラプロンプトの本家のピーキーさが若干マイルドになっている
Abydos-Noob
Koronemix Vpred
ネガプロなしでも奇麗に出る
欠点は全体的に色が弱い
copycat-noob v-pred
ネガプロなしでも奇麗に出る
Cat Tower v-pred
細部が安定しているので本家よりも複数出力が得意な面がある
色や絵柄は本家に若干劣る
Perpendicular-Cyberfix-V2
コントラストが本家より若干マイルドに
cyberfixのメソッドでmergeしたモデルはプロンプトの読解力はそのままで人体描写が若干改善という触れ込みだがそこらへんはあんまり変化を感じない
多分元の性能も別に悪くないせい
その他
RouWei v-pred
EPSモデルよりこっちの方が出来がいい
noobで出ないものが出るが逆に出るものが出なかったりする
複数出力はnoobより苦手