FLUX.1のLoRAを作成し、自分自身の画像を生成してみた
久しぶりの画像生成AIネタですが、以前から FLUX.1 用の LoRA を作成してみたいと思っていて、最近、ようやく試してみることができました。
権利関係もあるので、学習用の画像として、まずは自分自身のビジネスポートレートを使用し、Adobe Expressで背景を削除して透過PNG化したものを、20枚程度用意しました。おっさんの画像ですみませんw
ビジネスポートレートだと、どうしても真顔で正面を向いた写真になってしまいますが、できるだけ笑顔や横顔の写真、それから上半身の写真なども数枚入れてみました。
FLUX.1用のLoRAを作成するにはいくつか方法がありますが、現状、ローカルPCで生成するには、かなりのVRAMが必要になるようです。
そのため、今回は FLUX 1.1 [pro] や Recraft V3 で画像生成する時に使っている Replicate の ai-toolkit による FLUX.1用のトレーニングツール「flux-dev-lora-trainer」で作成することにしました。
Replicate の「flux-dev-lora-trainer」で LoRA を作成する方法は各所で解説されていますので、ここでは詳細は割愛しますが、トレーニングには $0.001525/秒のコストがかかり、今回の場合は生成に 7分51秒かかったので、約$0.72、111円程度となりました。
トレーニングが完了したら、生成された LoRA をダウンロードしたり、そのまま Prayground 上でプロンプトなどを入力して、画像生成を試してみることもできます。
次は、作成したLoRAをダウンロードし、OpenArt AI で公開されている ComfyUI ワークフローなどを参考にして、ローカルPCで画像生成してみます。
ComfyUI 上でいろいろ画像生成してみましたが、実物より少しイケメン風になっている気がするものの、なかなか良い感じですw
しかし、私自身、行ったこともない場所や、やったこともないことの写真を、いとも簡単に捏造できてしまうので、やはり、巷で話題になっているように、画像生成AI や LoRA の使い方には注意が必要ですね。