見出し画像

30,000枚のストックフォト制作に向けたAIツール選定

こんにちは。PhotographerのTakumiです。

前回お伝えした通り、AIを使ってストックフォト30,000枚を制作するプロジェクトを進めています。
今回は、このプロジェクトのAI画像ツールの選定についてお話しします。


選定条件:APIアクセスの重要性

30,000枚という大量の画像を効率的に制作するには、プロンプトのバッチ処理が可能なAPIアクセスが必須条件となります。
APIを利用することで、Pythonなどのプログラミング言語を使って画像生成プロセスを自動化できます。

APIとは何か? 〜自動化を可能にする仕組み〜

「API」という言葉を使いましたが、ここで簡単に説明させてください。

APIは「Application Programming Interface(アプリケーション・プログラミング・インターフェース)」の略です。少し難しく聞こえるかもしれませんが、要するに「ソフトウェア同士が会話するための共通言語」のようなものです。

具体例で理解する

たとえば、AIで画像を作る時のことを考えてみましょう:

  1. 手動の場合

    • ウェブサイトにアクセス

    • プロンプトを入力

    • 生成ボタンをクリック

    • 画像をダウンロード

    • これを1枚ずつ繰り返す

  2. APIを使う場合

    • コンピュータに「これらの作業を1000回繰り返して」と指示できる

    • 自動的に画像を生成・保存

    • 人は作業を見守るだけでOK

つまりAPIは、人間が手作業でやっていた作業を、コンピュータ同士で直接やりとりできるようにする「窓口」のような役割を果たすのです。

なぜAPIが重要か?

30,000枚という大量の画像を制作する今回のプロジェクトでは、手作業での制作は現実的ではありません。APIを使うことで:

  • 24時間休まず作業できる

  • ミスなく正確に処理できる

  • 大量の作業を効率的に行える

このような理由から、APIが利用できるかどうかは、ツール選定の重要な判断基準となっています。

自動化ツールMake.comによる初期テスト

最初のテストとして、Make.com というノーコードの自動化ツールを使ってみました。(PRリンク)

このツールは、アイコンを配置して線で繋ぐだけの直感的な操作で複雑な自動化が実現できます。プログラミングの知識がない私でも、以下のような作業を自動化することができました:

  1. Googleスプレッドシートからプロンプトを読み込む

  2. AI画像生成を実行

  3. 生成した画像をDropboxに保存

特に便利なのは、Googleスプレッドシートにプロンプトをまとめておけば、ワンクリックで多くの画像を一度に生成できる点です。業務の自動化や効率化を目指す方には、ぜひ試していただきたいサービスです。

Googleスプレッドシートからプロンプトを読み込み、各種ツールで処理を行った後、
最終的に生成画像をDropboxに保存する流れを表しています

主要な候補ツール

現在、写実的な表現力と商業利用可能なツールという観点から、以下の3つが候補として挙がっています:

  • Midjourney

    • 写実的な表現力は最高峰

    • 公式APIは利用不可(非公式な方法は存在)

    • 30,000枚制作には現実的ではない

  • FLUX1.1 PRO

    • 写実的な表現が可能

    • プロンプトの意図を忠実に再現

    • API利用可能

  • Leonardo.AI (PRリンク)

    • 高品質な画像生成が可能

    • API利用可能

    • AI特有の表現が出やすいが、イラスト的な表現には適している

    • 最近Canvaに買収され、今後の進展が期待される

新たな選択肢:Recraft V3

今週、Recraft V3(PR:登録で200クレジット付与)が新しいオプションとして登場しました。
APIアクセスが可能な点に加え、写実的な表現力の高さでも注目を集めています。

テスト結果の所見

  • APIの検証

    • Recraftのサイトで正常にAPI接続を確認

    • Replicateのサイトではスタイル・サイズ変更がうまくできず検証中

  • 使用感

    • Flux用のプロンプトで初期テストを実施

    • 写実的な表現に向いている印象

    • このツールに最適化されたプロンプトはまだ検証段階

    • ベクター画像生成も高品質で、ストックコンテンツとして有望

結論:現時点での選定結果と今後の展望

現時点では、ストックフォト制作においてはFLUX1.1 PROがより適していると判断しています。
ただし、Recraft V3も写真に近い仕上がりを実現しており、さらなる検証を進めていく予定です。

実際の制作では、出力画像をAIでスケールアップする工程も含むため、最終的な画質は後処理も含めて判断する必要があります。

柔軟な対応の重要性

AI画像生成ツールは日進月歩で進化しています。
当初は、プロンプトの作成方法や画像生成のワークフロー、自動化プロセスなどを固定的なフォーマットにしようと考えていました。

しかし、今回のRecraft V3の登場のように、予想以上のスピードで新しいツールや技術が登場しています。
このような状況では、厳密なフォーマットにとらわれず、状況に応じて臨機応変に対応していく方が賢明だと判断しました。

次回は、選定したツールを使用した具体的な制作フローについてご紹介する予定です。

いいなと思ったら応援しよう!