FLUX.1の自作lora zuzu v03参上です。
SDXLでの自作lora zuzuv02に続きましてFLUXバージョンのlora zuzuV03の学習に昨日から始めてなんと延々36時間連続ぶっとおしで1600ステップの学習でした。512pixにすればもっと早くできたと思いますけど、1024pixにしたからまる2日かかりました。それでは苦労して学習したFRUX版zuzu v03と
SDXL版zuzu v03の出力を比較してみたいと存じます。
rola学習には追加学習するための教師画像が必要なのですがSDXLのときは
kohya-ssスクリプトでしたので50枚で3000ステップ必要でしたが、今回はFRUXGYMという学習スクリプトですので10枚で1600ステップの学習でしたが、36時間という長丁場でした。
まずSDXLで」生成したzuzuの教師画像を一部8枚ご覧ください。
同じloraですから、プロンプトのよって多少雰囲気は代わりますがzuzu顔ですね。
次に同じプロンプトでSDXL版zuzu V02を左側、FLUX版zuzu V03wo右側に合成したものを比較してください。
ご覧のようにzuzu顔はDNAの様に維持されていますがリアリティーが格段に違います。SDXLは1枚10秒ほどで出来上がりますがFLUXは90秒程かかります。ですが、表現力、手の破綻の少なさ、プロンプトに対する追随性など
思い通りの画像を得るためにはやはりFLUXの表現力は捨てがたいですね。
渡しの場合は、AIの画像は下描きアシスタントで謂わばこの画像は下描きで作品にするにはこれらの気に入った部分を合成したり、輪郭をトレースして上からハンドリングで上書きしてしまうのでなかなか生のAI画像をお見せすることは本来的ではありませんけど、SDXLとFLUX違いと同じような顔の追加学習loraの効果を比較してもらえたらということで生成してみました。