
SDXLモデル開発記録 第2回目
序文
以前の記事のアップデート予定に書きました通り、Animagine v4ベースのモデルができましたので開発記録をこちらで掲載いたします。
Amethystic_Voice_Mix_XL v1
(CivitAIページ)
作例


開発コンセプト
開発コンセプトは毎度おなじみですが一言で言ってしまえば、『(製作者が考える)かわいいのために』です。
具体的にはいつもの通り、マスピ顔の低減、リアル感の低減、頭身の調整が主な目標です。
ライセンスが緩くなったため、いつものAmethystic_Sound_Mixとは別のモデルとしましたが、コンセプトとしては同じです。
マージ方法

ComfyUI上で上記の通りにマージしました。
制作したLoConの設定は下記の通りです。
データセット 38枚
リピート 3回
Epoc 60
Step 1740
プリセット SDXL - LoRA adafactor v1.0
Basic LyCORIS/LoCon
バッチサイズ 4
LR Scheduler adafactor
Optimizer adafactor
Network Rank (Dimension) 128
Network Alpha 128
サンプラーについて
作画崩壊を起こすもの(非推奨)
DPM fast
LMS
DPM++ 2M SDE Heun
DPM adaptive
PLMS
LCM
LCM Karras
生成速度が遅いもの
DPM++ SDE Karras
Heun
DPM2
DPM2 a
DPM++ 2S a
DPM++ SDE
DPM adaptive
DPM2 Karras
DPM2 a Karras
DPM++ 2S a Karras
Restart
※ステップ数を少なくすることで解決可能です。しかしながら、細部の書き込みがイマイチな印象を個人的には受けました。
以下余談
個人開発の限界
一人でモデルの開発をしているので、発表速度を優先するあまり極端なプロンプトへの影響が完璧には捉えられていません。
プロンプト内での不審な挙動がありましたら、こちらのNoteかCivitAI上でコメントいただけるとありがたいです。
今後のアップデート予定
Animagine XL v4からAnimagine XL v4 Optへの変更によって手の破綻は少なくなりましたが、まだ改善の余地があるのでバージョンアップの予定があります。
手の破綻が少なくてライセンス面で問題のないモデルが登場しない限り、時間がかかるかと思われます。
Illustrius版も並行して作業しますので、そちらもどうぞよろしくお願いします。(こちらに関してはライセンス面が今後どうなるのかが心配の種です)