見出し画像

【FLUX.1】LoRAのトレーニング時間を比較(意外な結果)

以前の記事でFLUX.1を使ったLoRAのトレーニングを説明しました。今回もai-toolkitを使って実験をします。

実験内容
512x512(pixel)の画像を5枚、10枚、15枚用意し、トレーニングをします。トレーンイグ用画像はComfyUI(FLUX.1-dev)で作成しました。

トレーニング用の画像(15枚)

キャプションは「Add AI captions with Florence-2」の結果をそのまま使用しました。
Advanced optionsはデフォルト通りです。
・Steps : 1000
・Learning Rate : 0.0004
・LoRA Rank : 16
・Model to train : dev
・Low VRAM : Yes
GPUはNVIDIA RTX A6000(GPUメモリ 48GB)です。

実験結果
(Load Flux model等の時間は除外し)トレーニング時間(step1〜1000の間)を手元タイマーで計りました。結果は5枚が41分、10枚が43分、15枚が42分となり、枚数に関わらず40-45分程度でトレーニングが完了しました。
枚数が増えればトレーニング時間が長くなると思っていただけに、予想外の結果になりました。
15枚のトレーニングより、10枚のトレーニングの方が時間かかっていたのは、同じPCで別の作業をしていたのが影響したかもしれません。

結論
今回の実験(ai-toolkitを利用したLoRAのトレーニング)では、画像の枚数がトレーニング時間に影響はありませんでした。(意外な結果)5枚と50枚で比較すれば、トレーニング時間に差がでるかもしれません。
もちろん、Step数は影響があり、Steps:500でトレーニングすれば、半分の約20分くらいで完了します。

5枚でトレーニング
10枚でトレーニング
15枚でトレーニング


いいなと思ったら応援しよう!