見出し画像

ストックフォト用AI画像生成|450プロンプト&1800サンプル画像&自動化シナリオ

こんにちは、写真家のTakumiです。

このガイドは以下のような方におすすめです:

  • ストックフォトビジネスに興味がある初心者の方

  • 従来のストックフォト制作者でAI活用を検討されている方

  • 効率的なAI画像生成の手法を探している方

450種のプロンプトと1,800枚の生成例を参考に、すぐにAIストックフォト制作を始めることができます。

以前ストックフォト販売で数億円の売上を達成した経験があります。業界の競争激化により一度制作を停止していましましたが、現在はAI画像生成による新しいアプローチを研究しています。
制作を始めてまだ数ヶ月の段階ですが、ある1点の作品だけでも7,000円以上の売上を記録するなど、予想以上の手応えを感じています。

AIストックフォトの可能性と特徴

メリット

  • 実写では困難なコンセプトの表現が可能

  • 制作コストの大幅削減

  • 素早い試行錯誤

  • 多様なバリエーションの生成

  • ロケーションやモデル手配が不要

  • 天候や時間帯に左右されない制作

現状での課題

  • 人物表現はまだ改善の余地あり

  • 高解像度での品質維持

  • 細部の一貫性

AI画像生成の検証リソース

今回の取り組みでは、ストックフォトとして需要が見込める150のトピックを選定し、それぞれに対して3種類のバリエーションでプロンプトを生成、合計450種類のプロンプトを作成しました。

これらのプロンプトを4つの主要なAI画像生成ツールで実行し、約1,800枚の画像を生成しています。同じプロンプトから生成された異なるツールの結果を比較することで、それぞれのツールの特徴や適性を検証するための基礎資料となっています。

サンプル画像とプロンプト

家庭のリビングルームで、子供と遊んでいるヒューマノイドロボットの姿。ロボットは柔らかな表情で子供と対話しており、部屋は暖かい光で満たされています。
A humanoid robot interacts playfully with a child in a cozy living room setting. The robot exhibits soft, human-like expressions as it engages with the child. The room is bathed in warm light, with soft shadows creating a homely atmosphere. The perspective is intimate, focusing closely on the interaction between the robot and the child, emphasizing the emotional connection.
緑豊かな観葉植物とキャンドル、ハーブティーのセットが並ぶ木製テーブルを描いた画像。柔らかい光が注ぎ穏やかでリラックスした雰囲気を演出。設定は「自然光のもとでのスパ空間」を想定。
A soothing spa setting with a wooden table adorned with lush greenery, candles, and a set of herbal teas. Soft, natural light pours in, creating a serene and relaxing atmosphere. The focus is on the textures of the wood and plants, and the gentle glow of the candles.
朝露に濡れた古民家の庭園。朝日が茅葺の屋根を照らし、木々の緑と相まって穏やかな雰囲気を醸し出しています。古木の質感と苔むした石が時の流れを感じさせる。
An old traditional Japanese house garden wet with morning dew, illuminated by the early sun hitting the thatched roof, creating a serene atmosphere. The texture of ancient trees and moss-covered stones evoke a sense of passing time, highlighted by the soft, natural lighting and the contrast of the vibrant greenery against the rustic structures.
年配の女性が自宅の庭で園芸をしている様子。彼女は笑顔で花壇に水をやっており、色とりどりの花が彩りを添えている。背景には緑豊かな庭木と小道が見える。
A joyful elderly woman in her seventies, watering a vibrant flowerbed in her lush backyard garden. Sunlight filters through the leaves, casting playful shadows and highlighting her silver hair. The garden is rich with various flowers and a small path winds through the background.
先進的な垂直農園での作業風景を捉えた写真。科学者がセンサーを使って植物の生育状況をチェックしている様子が描かれている。
A high-tech vertical farming scene featuring a scientist in a lab coat examining plant growth using advanced sensors. The image is a close-up, highlighting the precision and technology involved in modern agriculture. The background shows a neat arrangement of vertically arranged plants, bathed in soft artificial lighting, emphasizing a clean, scientific atmosphere.

トピックの3つの軸

まず、メイントピックを決めるためにChatGPTに以下のような指示を出してみました:

AIで作成するストック画像のトピックを考えてください。今後の需要を考慮し、世の中で注目されている主なテーマを挙げてください。例えば、自動運転、クリーンエネルギー、スマートホーム、医療、AI農業などです。実際に撮影が難しいものや、未来を感じさせるテーマを中心に、競争力のあるトピックを50個考えてください。画像生成のプロンプトとして使用できるよう、具体的かつ需要の高いものを意識してください。

興味深いことに、ChatGPTが提案したこれらのトピックは、私の実際のストックフォト販売経験とも合致する部分が多くありました。例えば、AI農業やクリーンエネルギー施設など、実写での撮影が困難な未来志向のコンテンツは、実際に高い売上を記録しているカテゴリーです。

このような実績を踏まえ、今回は以下の3カテゴリーでトピックを選定しています:

  • AI画像生成の強みを活かせるトピック (50件)

    • 実写撮影が困難なシーン

    • 未来的・概念的な表現 例:AI農業、スマートシティ、ロボット介護

  • 定番のストックフォトトピック (50件)

    • ビジネスシーン

    • ライフスタイル 例:オフィスワーク、健康的な食事、家族団らん

  • 人物を含まない需要の高いトピック (50件)(AIは人物描写がまだ不得意)

    • プロダクト

    • 風景

    • アブストラクト 例:スマートデバイス、テクノロジーコンセプト

AIで生成された画像は、実写と比べるとまだクオリティに課題がある部分もありますが、「実在していない」「撮影が極めて困難」なテーマについては、その需要を満たす唯一の選択肢として機能しています。

1. AIならではのトピック(50個)
自動運転都市・ドローン配送・スマートホーム・遠隔医療・医療ウェアラブル・バイオテクノロジー・クリーンエネルギー都市・AI農業・垂直農法・水素エネルギー・宇宙太陽光・海洋風力発電・スマートグリッド・次世代蓄電池・ブロックチェーン取引・フィンテック・量子コンピュータ・交通管制システム・ロボティック警備・多言語翻訳デバイス・AR教育・VR学習・メタバースショッピング・ホログラム接客・次世代通信・衛星インターネット・スマートウェアセキュリティ・ヒューマノイドロボット・エクソスケルトン・遠隔勤務・スマートファッション・サステナブル建築・クリーンエネルギー車両・海洋清掃ロボット・カーボンリサイクル・宇宙旅行・火星コロニー・深海探査・気候変動対策・デジタルツイン都市・コネクテッドカー・スマートライフ・農業ロボット・ハイパーループ・AIアシスタント・スマートウォーター管理・バーチャルイベント・ドローンタクシー・コグニティブマーケティング・サイバーパンク夜景
2. 一般的なストックフォト需要(50個)
ビジネス会議・共同作業・多様性職場・スタートアップ・ワーケーション・インタビュー・オンライン会議・家族団らん・子どもの学習・シニアの暮らし・カップルアウトドア・世界の料理・カフェシーン・ヘルシー食事・フィットネス・旅行・交通手段・自然風景・都市夜景・季節行事・多文化交流・ペット暮らし・DIY・プロダクト撮影・SNSマーケ・電子機器・教育現場・医療現場・美容コスメ・ファッション・エコ活動・スポーツ観戦・結婚式・パーティー・音楽ライブ・リラックス・ボランティア・金融投資・法律契約・フリーランス・ショッピング・レストラン・アート制作・プログラミング・交通安全・ガーデニング・ホテルリゾート・コミュニケーション・健康産業・新生活
3. 人物を含まない需要の高いトピック(50個)
サステナビリティ素材・ミニマルロゴ・メタバース背景・スーパーフード・デジタルアート・未来都市・和モダン・クラフトビール・スマートホーム・季節の花・伝統工芸品・オーガニック食材・環境テクノロジー・抽象的なグラデーション・宇宙空間・マインドフルネス・発酵食品・ワークスペース・SDGs関連アイコン・幾何学模様・ペット用品・カフェドリンク・エコパッケージ・日本の四季・テクノロジーアイコン・建築デザイン・自然テクスチャ・クリプトアート・ウェルネス商品・モダン和菓子・サイバーセキュリティ・古民家・ビジネスアイコン・地方特産品・NFTデザイン・フィンテック・ゼロウェイスト・野菜・果物・アウトドアギア・デジタル通貨・日本庭園・スマートシティ・リサイクル素材・伝統文様・クリーンエネルギー・モダンインテリア・バイオテクノロジー・地域観光・デジタルトランスフォーメーション・和ハーブ

AIツール別の特徴

今回、検証に使用したツール(すべて商業利用可能なモデル)

  • Flux schnell

  • Flux 1.1-pro-ultra

  • Recraft

  • Leonardo.ai

この記事にはアフィリエイトリンクが含まれています

※Midjourney、Stable Diffusionなど、他にも優れたAI画像生成ツールが存在しますが、今回は大量の画像を効率的に生成するため、APIが利用可能なツールを優先して選定しています。

各ツールの特徴と価格

Flux schnell

  • 高速プレビュー生成に適している

  • 画質:標準的な品質

  • 生成速度:非常に速い

  • 価格:1枚約0.5円($0.003)

    • $1で約333枚生成可能

  • 用途:プロンプトのテストや方向性の確認 

    • コストが非常に安価(450枚でも約$1.35)なため、まずこのモデルで画像を生成・プロンプトの確認

    • 結果を見て他の高品質モデルでの本制作の判断材料として活用

    • 販売用のストックフォトに採用される事はあまりない

Flux 1.1-pro-ultra

  • 解剖学的な正確さと質感表現に優れる

  • 画質:高品質

  • 生成速度:標準的

  • 価格:1枚約9円($0.06)

    • $1で約16枚生成可能

  • 用途:人物や複雑なシーンの生成

Recraft

  • シャープな描写とテキスト表現が得意

  • 画質:鮮明で色彩豊か

  • 生成速度:標準的

  • 人物表現:比較的自然な人物生成が可能

    • AIっぽさの少ない一般的な人物表現

    • 違和感の少ない表情や姿勢

  • 価格:1枚約3.3円($0.022)

    • $1で約45枚生成可能

  • 今回は効率を考えてAPIを使用していますがRecraftのサイトでマニュアルで調整しながら作っていくのがお勧め

Leonardo.ai

  • 画質:安定した品質

  • 生成速度:高速

  • 多彩なモデル選択

    • SD 1.5ベースのモデル

    • Fluxベースのモデル

    • Leonardoオリジナルモデル

    • その他さまざまなモデルに対応

  • 追加機能

    • 動画生成が可能

    • モデルのファインチューニング

  • 価格:1枚約7.5円($0.05)から

    • モデルによって価格が異なる

    • モデルや設定項目が多く、最適な設定の選択に時間がかかる

    • クレジット制で価格の事前見積もりが難しい

  • 用途:大量生成、効率的な処理、動画コンテンツ制作

プロンプト生成から画像作成まで

今回の検証では、以下のような自動化されたワークフローを構築しました

  1. ChatGPTによるプロンプト生成

  2. スプレッドシートでの管理

  3. Make.comでのプロンプト生成の自動化

  4. Pythonスクリプトによる画像生成の自動化

    • Googleスプレッドシートからプロンプトの読み込み

    • 各AIツールへの自動送信

    • 生成画像のローカル保存

    • スプレッドシートへの画像リンクの自動記録

Pythonのコードを実行することで、生成された画像は自動でローカルに保存され、Googleスプレッドシートに画像が今表示されます。
このスプレッドシートで、プロンプトや画像を確認し、修正セレクトをして用途に合わせてAI画像生成のツールを実行していきます。

現在の自動化システム

私自身は、MacのPythonスクリプトを活用して完全自動化システムを構築しています。これにより、4つのAIツールすべての生成からデータ管理まで、ほぼ自動で処理することが可能です。

本記事では、Make.comとLeonardo.aiの連携による基本的な自動化の方法をご紹介しますが、さらなる効率化の可能性を秘めています。

Make.comでのプロンプト生成の自動化

ChatGPTに提案してもらったメインのトピックをスプレッドシートに入力します。

次に、このメイントピックから、Make.comを使用して、AI画像生成のプロンプトを作成します。

スプレッドシートからメイントピックを読み込んで、
ChatGPTでプロンプトを作ると言うシナリオです

ChatGPTの指示の部分は以下


You are an AI assistant specialized in generating stock photography image descriptions. Your task is to create THREE versions of descriptions for each variation based on a given topic.

Topic: {{3.value}}

Before generating the descriptions, please analyze the following aspects:
<image_analysis>

  1. Analyze the topic and list 3-5 key elements that could be visualized

  2. Consider the setting: indoor or outdoor? Urban or rural? Professional or casual?

  3. Think about the main subject(s): person, object, or scene?

  4. Describe the composition: close-up, wide shot, or medium?

  5. Note any current trends in stock photography

  6. Consider the mood or emotion to convey

  7. Identify any symbolism or metaphors

  8. Avoid elements difficult for AI to generate
    </image_analysis>

Generate exactly 3 variations using this precise format:

summary_ja: [30文字以内の簡潔な日本語要約]
prompt_ja: [100-150文字の詳細な日本語プロンプト]
prompt_en: [一般的な説明は避け、代わりに照明の種類、物体の配置、視点、特定の芸術スタイルやテーマなど、シーンのあらゆる要素を詳細に説明した英語プロンプト]

[Same format continues]

Format requirements:

  • Start each variation with a number followed by a period (1., 2., etc.)

  • Use exact labels: "summary_ja:", "prompt_ja:", "prompt_en:"

  • Include one blank line between variations

  • Maintain consistent formatting throughout all variations


そして、Make.comを稼働させます。
およそ20分で150トピック合計450のAI画像生成のプロンプトが作成されました。

これらのワークフローによって、メインのトピックを考えることに集中して、画像生成はほとんど自動で行われ、セレクト、編集に集中できます。

メイントピックは、以前記事で紹介したサイトを参考にして探しています。


有料コンテンツの内容

  1. プロンプトライブラリ

    • 150トピック×3バリエーション(450種)

    • 英語プロンプトと日本語の意訳付き

    • すぐに使えるcsv形式

  2. 生成画像サンプル集

    • 4つのAIツールでの生成例(約1,800枚)

    • ツール別の特徴比較用データ

    • 商用利用可能な高解像度画像

    • 重要な注意点: 現状のAI画像生成では、人物写真の品質にまだ制限があります。特に人物がアクションをしている シーンでは、ほとんどの画像が修正なしでの商用利用は難しい品質です。シンプルなポートレート 以外の人物画像については、AIの技術向上を待つことをお勧めします。

  1. Make.comのシナリオ(2種)

    • プロンプト自動生成システム

    • プロンプトからLeonardo.AIを使った自動画像生成

※ 本記事で紹介したMacでのPythonスクリプトを使用した完全自動化システム(画像生成の自動化やGoogleスプレッドシートへの画像貼り付けなど)は含まれていません。

必要な準備

基本(コンテンツの閲覧・参照用)

  • Googleアカウント

ご自身でプロンプト作成、画像生成を行う場合の追加準備

  • Make.comアカウント

    • 1000オペレーションまで無料

    • プロンプト、画像自動生成に使用

  • ChatGPT APIキー

    • 450プロンプト生成で約$3

    • プロンプト自動生成に必要

  • Leonardo.ai APIキー

    • 9ドルで3,500クレジット

    • 約160枚の画像生成が可能

ここから先は有料コンテンツとなります。上記リソースへのアクセス方法と詳細な設定手順をご覧いただけます。


ここから先は

3,328字 / 41画像

¥ 5,000

この記事が気に入ったらチップで応援してみませんか?