SDXL1.0でLoRA作りました
見出しの通り、7/27に公開されたSDXL1.0でLoRAを作成しました。
こんな感じのケモキャラ生成LoRAです。
私自身はそれほどLoRA作成に手慣れているわけでもなく、経験も少ないですが、とりあえず出来たは出来たということで、設定値等を共有したいと思います。
(細かい部分はあまり分かっていないので聞かれても答えられないと思います。雰囲気でAIをやっている。)
使用したグラフィックボード
RTX3060 12GBで作成しています。
SDXLのLoRA作成はSD1系よりもメモリ容量が必要です。
(これはマージ等も同じ)
ですので、1系で実行出来ていた設定ではメモリが足りず、より低VRAMな設定にする必要がありました。
学習に使用した素材
1系で使用した画像データをそのまま流用しました。
過去に1系/2系でLoRA作成をしたことがある方は設定値を変えるだけで、そのまま試すことが出来ると思います。
ちなみに、1系バージョンのLoRAはこちら。
実行コマンド全文
変に細かく書いても分かりづらいと思うので、
コマンド丸ごとごそっと貼っちゃいます。
実行自体はKohya_ss GUIから行っています。
慎重を期してtrain_batch_size="1"になっていますが、
後日"4"でもいけました。
所要時間はbatch_size1で8時間程度だったので、
4なら2時間程度で済むはずです。
Tips
ここからはちょっとしたメモです。
SDXL用の推奨設定値
GitHubにSDXLのトレーニングに関するガイドが載っています。
まずはこちらを見ると良いと思います。
GUIを使っている場合、Guidesタブにも同様の記載があります。
GUIでの設定個所
赤ラインはGuidesにあるSDXLでの推奨設定です。
黄ラインは私が手当たり次第に入れた低VRAM設定です。
(合ってるかはともかく動いた)
最後に
とりあえず勢いで作ったので、これが最適解かは分かりませんが、設定でどうにも詰まっている方のヒント等になれば幸いです。
追記(8/1 11:30)
hugging faceにkohya_ss GUIの学習設定用jsonファイル置きました。
GUIで読み込めば上に書いた実行コマンドを再現できます。