見出し画像

FLUX.1のLoRAを作成し、自分自身の画像を生成してみた

久しぶりの画像生成AIネタですが、以前から FLUX.1 用の LoRA を作成してみたいと思っていて、最近、ようやく試してみることができました。

権利関係もあるので、学習用の画像として、まずは自分自身のビジネスポートレートを使用し、Adobe Expressで背景を削除して透過PNG化したものを、20枚程度用意しました。おっさんの画像ですみませんw

ビジネスポートレートだと、どうしても真顔で正面を向いた写真になってしまいますが、できるだけ笑顔や横顔の写真、それから上半身の写真なども数枚入れてみました。

学習に使用した画像

FLUX.1用のLoRAを作成するにはいくつか方法がありますが、現状、ローカルPCで生成するには、かなりのVRAMが必要になるようです。

そのため、今回は FLUX 1.1 [pro] や Recraft V3 で画像生成する時に使っている Replicate の ai-toolkit による FLUX.1用のトレーニングツール「flux-dev-lora-trainer」で作成することにしました。

Replicate の「flux-dev-lora-trainer」で LoRA を作成する方法は各所で解説されていますので、ここでは詳細は割愛しますが、トレーニングには $0.001525/秒のコストがかかり、今回の場合は生成に 7分51秒かかったので、約$0.72、111円程度となりました。

Replicateの「flux-dev-lora-trainer」設定画面
Replicateの「flux-dev-lora-trainer」実行完了

トレーニングが完了したら、生成された LoRA をダウンロードしたり、そのまま Prayground 上でプロンプトなどを入力して、画像生成を試してみることもできます。

Playground 上で FLUX.1[dev] + LoRA による画像生成

次は、作成したLoRAをダウンロードし、OpenArt AI で公開されている ComfyUI ワークフローなどを参考にして、ローカルPCで画像生成してみます。

ComfyUI 上で FLUX.1[dev] + LoRA による画像生成

ComfyUI 上でいろいろ画像生成してみましたが、実物より少しイケメン風になっている気がするものの、なかなか良い感じですw

古いアパートの階段に座って微笑む
エプロンを付けてフライパンで目玉焼きを作る
帽子をかぶってロックンロールを熱唱
凱旋門の前のカフェで朝食&お仕事

しかし、私自身、行ったこともない場所や、やったこともないことの写真を、いとも簡単に捏造できてしまうので、やはり、巷で話題になっているように、画像生成AI や LoRA の使い方には注意が必要ですね。

いいなと思ったら応援しよう!