
【ComfyUI】商用利用可能なFLUX.1[dev]並のモデル登場!OpenFLUX.1を評価してみた
画像生成AIの進化は止まりません。新たに登場した「OpenFLUX.1」は、すでに高評価を得ているFLUX.1-schnellモデルをベースに、「蒸留」を取り除いたことで、さらに高い柔軟性を持ったオープンソースのツールです。従来のモデルが持つ課題を克服しつつ、微調整(ファインチューニング)が可能な設計で、より高品質な画像をわずか数ステップで生成できます。
この記事では、OpenFLUX.1がどのような点で進化したのか、具体的な生成結果や他モデルとの比較を通じて、その真価を検証していきます。
1. OpenFLUX.1 とは?
OpenFLUX.1 は、FLUX.1-schnell モデルを微調整し、「蒸留」を取り除いたバージョンです。FLUX.1-schnell モデルは Apache 2.0 ライセンスで提供されており、非常に優れたモデルですが、「蒸留」が施されているため微調整ができませんでした。しかし、このモデルは1~4ステップで驚くほど高品質な画像を生成することができます。OpenFLUX.1 は、この「蒸留」を取り除き、オープンソースかつ許容的なライセンスのもとで微調整が可能なモデルを目指して開発されました。
2. ComfyUIでの使用準備
OpenFLUX.1をComfyUIで使用できるfp8のweightsを作成してくださっています。こちらのモデルをダウンロードし、「ComfyUI/models/checkpoints」フォルダに格納してください。
ワークフローは、ComfyUI Examplesにある「FP8 Checkpoint version」のワークフローが使用できます。以下からfp8バージョンのschnell用のワークフローをダウンロードしてください。
3. 生成結果の検証
OpenFLUX.1の生成結果を検証するために、devとの比較をしてみます。それぞれ以下の条件で生成します。
Seed: 232145193935489
CFG:
OpenFLUX.1: 3.5(OpenFLUX.1のモデルページにて3.5がベストと記載あり)
FLUX.1[dev]: 1.0(サンプルワークフローに準拠)
Steps:
OpenFLUX.1: 30(20だとぼやけることが多い)
FLUX.1[dev]: 20(サンプルワークフローに準拠)
Sampler: euler
Scheduler: simple
以下に様々なプロンプトで生成結果を比較した画像を載せていきます。左上に「dev」と書かれているのがFLUX.1[dev]で、「OF」と書かれているのがOpenFLUX.1になります。



























devやschnellと比較した際のOpenFLUXの評価は、以下の通りです。
devと同じような構図で画像が出力されている
元のschnellと比較して、かなり品質とプロンプト忠実性が高まっている
プロンプト忠実性はdevに近づいたとはいえ、やはりdevの方が高い
例えば、「A group of adventurers consisting of a knight, a mage, and a rogue, standing at the entrance of a dark, foreboding cave. The knight’s sword glows faintly, illuminating their path.」のプロンプトでは、knight、mage、rogueの3人が描写されるべきで、devは3人だが、OpenFLUXは4人になっている
devと同様に文字の出力が可能
人種の描き分けも可能
手の描写が若干弱いか
複数人、カメラアングルが遠方になると、形が崩れやすくなる
devは品質を保持できている
まとめ
OpenFLUX.1 は、微調整が可能なオープンソースの強力なツールであり、画像生成の分野でさらなる自由度を提供します。
今回は、品質を評価しましたが、OpenFLUX.1の真価は、ファインチューニングを可能にしたことです。今後はSDXLのように様々なCheckpointが登場するのではないでしょうか。
OpenFLUX.1の登場で、完全にSDXLは終焉になるでしょう。FLUXが登場してからもSDXLが存在感を発揮していたのは、FLUXではセルフホスティング環境での商用利用の形でファインチューニングされたモデルを公開できなかったことが大きな要因だと考えています。これがセルフホスティング環境での商用利用可能なファインチューニングモデルを公開できるようになるのでしたら、基礎性能の高いFLUXにユーザーが移るのは定石でしょう。
OpenFLUX.1は、市場のゲームチェンジャーになるでしょう。今後のアップデートや、OpenFLUX.1を中心とした各種モデルの登場に期待しましょう!

この記事でご紹介したAI技術の応用方法について、もっと詳しく知りたい方や、実際に自社のビジネスにAIを導入したいとお考えの方、私たちは、企業のAI導入をサポートするAIコンサルティングサービスを提供しています。以下のようなニーズにお応えします。
AIを使った業務効率化の実現
データ分析に基づくビジネス戦略の立案
AI技術の導入から運用・教育までの全面サポート
専門家によるカスタマイズされたAIソリューションの提案
初回相談無料ですので、お気軽にご相談ください。以下のリンクからお問い合わせください。