SDXLモデル開発記録　第2回目

きのくまりん

2025年2月18日 15:18

序文

　以前の記事のアップデート予定に書きました通り、Animagine v4ベースのモデルができましたので開発記録をこちらで掲載いたします。

Amethystic_Voice_Mix_XL v1

（CivitAIページ）

作例

CivitAI上だと水着をプロンプトに入れると確実にR判定を食らう（IL版で一敗）

開発コンセプト

　開発コンセプトは毎度おなじみですが一言で言ってしまえば、『（製作者が考える）かわいいのために』です。
　具体的にはいつもの通り、マスピ顔の低減、リアル感の低減、頭身の調整が主な目標です。
　ライセンスが緩くなったため、いつものAmethystic_Sound_Mixとは別のモデルとしましたが、コンセプトとしては同じです。

マージ方法

　ComfyUI上で上記の通りにマージしました。
　制作したLoConの設定は下記の通りです。

データセット　38枚
リピート　3回
Epoc　60
Step　1740
プリセット　SDXL - LoRA adafactor v1.0
Basic　LyCORIS/LoCon
バッチサイズ　4
LR Scheduler　adafactor
Optimizer　adafactor
Network Rank (Dimension)　128
Network Alpha　128

サンプラーについて

作画崩壊を起こすもの（非推奨）

DPM fast
LMS
DPM++ 2M SDE Heun
DPM adaptive
PLMS
LCM
LCM Karras

生成速度が遅いもの

DPM++ SDE Karras
Heun
DPM2
DPM2 a
DPM++ 2S a
DPM++ SDE
DPM adaptive
DPM2 Karras
DPM2 a Karras
DPM++ 2S a Karras
Restart
※ステップ数を少なくすることで解決可能です。しかしながら、細部の書き込みがイマイチな印象を個人的には受けました。

以下余談

個人開発の限界

　一人でモデルの開発をしているので、発表速度を優先するあまり極端なプロンプトへの影響が完璧には捉えられていません。
　プロンプト内での不審な挙動がありましたら、こちらのNoteかCivitAI上でコメントいただけるとありがたいです。

今後のアップデート予定

　Animagine XL v4からAnimagine XL v4 Optへの変更によって手の破綻は少なくなりましたが、まだ改善の余地があるのでバージョンアップの予定があります。
　手の破綻が少なくてライセンス面で問題のないモデルが登場しない限り、時間がかかるかと思われます。
　Illustrius版も並行して作業しますので、そちらもどうぞよろしくお願いします。（こちらに関してはライセンス面が今後どうなるのかが心配の種です）