見出し画像

SDXLモデル開発記録 第2回目


序文

 以前の記事のアップデート予定に書きました通り、Animagine v4ベースのモデルができましたので開発記録をこちらで掲載いたします。

Amethystic_Voice_Mix_XL v1

(CivitAIページ)

作例

CivitAI上だと水着をプロンプトに入れると確実にR判定を食らう(IL版で一敗)
余談だが、筆者はビールが飲めない(苦みが苦手)

開発コンセプト

 開発コンセプトは毎度おなじみですが一言で言ってしまえば、『(製作者が考える)かわいいのために』です。
 具体的にはいつもの通り、マスピ顔の低減、リアル感の低減、頭身の調整が主な目標です。
 ライセンスが緩くなったため、いつものAmethystic_Sound_Mixとは別のモデルとしましたが、コンセプトとしては同じです。

マージ方法

データセットはIL版を作った時と同じ

 ComfyUI上で上記の通りにマージしました。
 制作したLoConの設定は下記の通りです。

  • データセット 38枚

  • リピート 3回

  • Epoc 60

  • Step 1740

  • プリセット SDXL - LoRA adafactor v1.0

  • Basic LyCORIS/LoCon

  • バッチサイズ 4

  • LR Scheduler adafactor

  • Optimizer adafactor

  • Network Rank (Dimension) 128

  • Network Alpha 128

サンプラーについて

作画崩壊を起こすもの(非推奨)

DPM fast
LMS
DPM++ 2M SDE Heun
DPM adaptive
PLMS
LCM
LCM Karras

生成速度が遅いもの

DPM++ SDE Karras
Heun
DPM2
DPM2 a
DPM++ 2S a
DPM++ SDE
DPM adaptive
DPM2 Karras
DPM2 a Karras
DPM++ 2S a Karras
Restart
※ステップ数を少なくすることで解決可能です。しかしながら、細部の書き込みがイマイチな印象を個人的には受けました。

以下余談

個人開発の限界

 一人でモデルの開発をしているので、発表速度を優先するあまり極端なプロンプトへの影響が完璧には捉えられていません。
 プロンプト内での不審な挙動がありましたら、こちらのNoteかCivitAI上でコメントいただけるとありがたいです。

今後のアップデート予定

 Animagine XL v4からAnimagine XL v4 Optへの変更によって手の破綻は少なくなりましたが、まだ改善の余地があるのでバージョンアップの予定があります。
 手の破綻が少なくてライセンス面で問題のないモデルが登場しない限り、時間がかかるかと思われます。
 Illustrius版も並行して作業しますので、そちらもどうぞよろしくお願いします。(こちらに関してはライセンス面が今後どうなるのかが心配の種です)


いいなと思ったら応援しよう!