見出し画像

【簡単】最新の画像生成AIモデルFLUX.1の使い方〜生成AIを使いこなしたい方へ〜

こんにちは、まさひろです。
本記事の目的は「最新の画像生成AIモデルの説明」をあなたが出来るようになることです。3分で読めます。

✔なぜこの記事を書くか?

「AIの時代が来る」この事実より僕が知りたいことは「目の前の業務をAIがどれほど効率化してくれるか?」でした。

しかし現実は違います。AIツールが無数に生まれる今「どのサービスを使うべきか分からない、、GPT-4oは一応使っとくか」こんな感じです。

モデル「FLUX.1 schnell」で生成した画像

この「なんとなくな現状」を打破し、意味を持ってAIを使いこなす為に「そもそも、最新の生成AIモデルで何を実現できるか?」を知る必要があると思ってます。その為、本記事では1つの具体的な活用例として最新の画像生成モデル「FLUX.1の使い方」を簡単に紹介します。

FLUX.1とは「Black Forest Labs(株)が開発した最新の画像生成AIモデル」です。

モデル理解

モデル「FLUX.1 pro」で生成された画像

リリースされた画像生成AIモデルは3種類です。

※  上から性能が高い順です。

①高性能モデル : FLUX.1 pro

APIのみ利用可能。

②中性能モデル : FLUX.1 dev

proと同等の品質を持つオープンなモデル。非商用に限りダウンロードしてローカルで使用可能(ただ、モデルファイルが23GBもある)。

③低性能モデル : FLUX.1 schnell

最速・最も軽量なモデル Apache 2.0ライセンスで公開されていて、 個人利用から商用利用まで自由に利用可能。

使い方

下記4つのサイトより画像生成・画像ダウンロードできます。

Hugging Face

SeaArt AI

全モデルを提供しているサイトは上2つですFLUX.1 proモデルのみ提供しているサイトは下2つです。(APIの利用申請が必要です。)

fal

Replicate

特徴理解

モデル「FLUX.1 pro」で生成された画像

2024年8月17日現在、最高品質の画像生成AIモデルと言われています。(正確には5つの評価指標があり、全てハイスコアを取得)

  • ①特徴:高品質な画像生成能力

    • MidjourneyやStable Diffusionより高品質と言われている。(人間の手もしっかりと5本で出力してくれる)

  • ②特徴:多様な出力

    • 画像モデルの性能を表す5つの指標である①視覚的品質②プロンプト追従③サイズ / アスペクト多様性④タイポグラフィ⑤出力多様性全てにおいてハイスコアを叩き出した。

  • ③特徴:著作権はユーザーに帰属

    • ユーザに著作権があるため、他の画像生成サービスより比較的利用しやすい。

API料金

モデル「FLUX.1 schnell」で生成された画像

APIの料金は1枚あたり約8円

Replicateやfal.aiでは、GitHubアカウントを使用してログインが必要で、個人的には、無料利用枠が多い点でfal.aiがおすすめです。

Midjourneyは月額10ドルで200枚まで生成可能なので、コスト面で大きな差はありませんが、FLUX.1はAPIが利用可能である点が優れてます(Midjourneyには"公式"のAPIは存在しない為)

  • FLUX.1 proは「0.055ドル(約8円)」

  • FLUX.1 devは「0.030ドル(約4円)」

  • FLUX.1 schnell「0.003ドル(約0.4円)」

FLUX.1 dev・schnellに限り、ローカルで実行する場合は無料でつかえます。

会社理解

モデル「FLUX.1 schnell」で生成された画像

Black Forest Labs(株)

  • Stable Diffusion(オープンソースの画像生成AIモデル)の共同開発者が設立。

  • 3100万ドル(45億ほど)の資金調達に成功

4ステップで生成する為、かなり出力も高速度です!
(SDXL Lightningみたいな)

というわけで、以上です。LLMの進化を楽しみましょう!😌


この記事が気に入ったらサポートをしてみませんか?