見出し画像

【Flux.1】やっぱりFlux.1のLoRAは必要ないかも【SD1.5】

はじめに

Flux.1→SD1.5(with LoRa)を交互にimg2imgする手法で作成したものです。

生成結果

SD1.5スタートです。SD1.5→Flux.1→SD1.5→Flux1→SD1.5で、Flux.1モデルはSchnellのGGUF版(4step)を利用しています。

髪の毛とリボンが一体化してるのが残念です。
崩れたマイクの形状が回復したのはさすがFlux.1です
ファンタジー感のない貧相なリアルコスプレ
Flux.1は制服系をアニメ化したがるので顔が大きくなってしまい、その結果幼くなってしまうようです

まとめ

Flux.1 Schnell GGUF版でも品質はほとんど変らないようです。

利用しているAIモデルは以下のものですが、それぞれが欠点を補い合っているように思います。

  • Stable Diffusion 1.5

    • ○LoRAをはじめ、すべてにおいて画像をコントロールしやすい

    • ○軽量で高品質

    • ☓プロンプト追従性は悪い

  • Flux.1

    • ○背景や手指等の破綻を回復してくれる

    • ☓遅い・重い

    • ☓細部や画風・タッチのコントロールが難しい

  • 4x_NMKD-Superscale-SP_178000_G.pth(ESRGAN)

    • のっぺりせずに画像をアップスケール

  • llava-llama3(LLM Visionモデル)

    • Flux.1との相性が非常に良い


以下、関連する記事の【PR】です。


いいなと思ったら応援しよう!