見出し画像

【Flux.1】やっぱりFlux.1のLoRAは必要ないかも【SD1.5】

2024年10月22日 23:45

はじめに

Flux.1→SD1.5(with LoRa)を交互にimg2imgする手法で作成したものです。

生成結果

SD1.5スタートです。SD1.5→Flux.1→SD1.5→Flux1→SD1.5で、Flux.1モデルはSchnellのGGUF版（4step）を利用しています。

髪の毛とリボンが一体化してるのが残念です。

崩れたマイクの形状が回復したのはさすがFlux.1です

ファンタジー感のない貧相なリアルコスプレ

Flux.1は制服系をアニメ化したがるので顔が大きくなってしまい、その結果幼くなってしまうようです

まとめ

Flux.1 Schnell GGUF版でも品質はほとんど変らないようです。

利用しているAIモデルは以下のものですが、それぞれが欠点を補い合っているように思います。

Stable Diffusion 1.5
- ○LoRAをはじめ、すべてにおいて画像をコントロールしやすい
- ○軽量で高品質
- ☓プロンプト追従性は悪い
Flux.1
- ○背景や手指等の破綻を回復してくれる
- ☓遅い・重い
- ☓細部や画風・タッチのコントロールが難しい
4x_NMKD-Superscale-SP_178000_G.pth（ESRGAN）
- のっぺりせずに画像をアップスケール
llava-llama3（LLM Visionモデル）
- Flux.1との相性が非常に良い

以下、関連する記事の【PR】です。

いいなと思ったら応援しよう！