
ストックフォト用AI画像生成|450プロンプト&1800サンプル画像&自動化シナリオ
こんにちは、写真家のTakumiです。
このガイドは以下のような方におすすめです:
ストックフォトビジネスに興味がある初心者の方
従来のストックフォト制作者でAI活用を検討されている方
効率的なAI画像生成の手法を探している方
450種のプロンプトと1,800枚の生成例を参考に、すぐにAIストックフォト制作を始めることができます。
以前ストックフォト販売で数億円の売上を達成した経験があります。業界の競争激化により一度制作を停止していましましたが、現在はAI画像生成による新しいアプローチを研究しています。
制作を始めてまだ数ヶ月の段階ですが、ある1点の作品だけでも7,000円以上の売上を記録するなど、予想以上の手応えを感じています。
AIストックフォトの可能性と特徴
メリット
実写では困難なコンセプトの表現が可能
制作コストの大幅削減
素早い試行錯誤
多様なバリエーションの生成
ロケーションやモデル手配が不要
天候や時間帯に左右されない制作
現状での課題
人物表現はまだ改善の余地あり
高解像度での品質維持
細部の一貫性
AI画像生成の検証リソース
今回の取り組みでは、ストックフォトとして需要が見込める150のトピックを選定し、それぞれに対して3種類のバリエーションでプロンプトを生成、合計450種類のプロンプトを作成しました。
これらのプロンプトを4つの主要なAI画像生成ツールで実行し、約1,800枚の画像を生成しています。同じプロンプトから生成された異なるツールの結果を比較することで、それぞれのツールの特徴や適性を検証するための基礎資料となっています。
サンプル画像とプロンプト

A humanoid robot interacts playfully with a child in a cozy living room setting. The robot exhibits soft, human-like expressions as it engages with the child. The room is bathed in warm light, with soft shadows creating a homely atmosphere. The perspective is intimate, focusing closely on the interaction between the robot and the child, emphasizing the emotional connection.

A soothing spa setting with a wooden table adorned with lush greenery, candles, and a set of herbal teas. Soft, natural light pours in, creating a serene and relaxing atmosphere. The focus is on the textures of the wood and plants, and the gentle glow of the candles.

An old traditional Japanese house garden wet with morning dew, illuminated by the early sun hitting the thatched roof, creating a serene atmosphere. The texture of ancient trees and moss-covered stones evoke a sense of passing time, highlighted by the soft, natural lighting and the contrast of the vibrant greenery against the rustic structures.

A joyful elderly woman in her seventies, watering a vibrant flowerbed in her lush backyard garden. Sunlight filters through the leaves, casting playful shadows and highlighting her silver hair. The garden is rich with various flowers and a small path winds through the background.

A high-tech vertical farming scene featuring a scientist in a lab coat examining plant growth using advanced sensors. The image is a close-up, highlighting the precision and technology involved in modern agriculture. The background shows a neat arrangement of vertically arranged plants, bathed in soft artificial lighting, emphasizing a clean, scientific atmosphere.
トピックの3つの軸
まず、メイントピックを決めるためにChatGPTに以下のような指示を出してみました:
AIで作成するストック画像のトピックを考えてください。今後の需要を考慮し、世の中で注目されている主なテーマを挙げてください。例えば、自動運転、クリーンエネルギー、スマートホーム、医療、AI農業などです。実際に撮影が難しいものや、未来を感じさせるテーマを中心に、競争力のあるトピックを50個考えてください。画像生成のプロンプトとして使用できるよう、具体的かつ需要の高いものを意識してください。
興味深いことに、ChatGPTが提案したこれらのトピックは、私の実際のストックフォト販売経験とも合致する部分が多くありました。例えば、AI農業やクリーンエネルギー施設など、実写での撮影が困難な未来志向のコンテンツは、実際に高い売上を記録しているカテゴリーです。
このような実績を踏まえ、今回は以下の3カテゴリーでトピックを選定しています:
AI画像生成の強みを活かせるトピック (50件)
実写撮影が困難なシーン
未来的・概念的な表現 例:AI農業、スマートシティ、ロボット介護
定番のストックフォトトピック (50件)
ビジネスシーン
ライフスタイル 例:オフィスワーク、健康的な食事、家族団らん
人物を含まない需要の高いトピック (50件)(AIは人物描写がまだ不得意)
プロダクト
風景
アブストラクト 例:スマートデバイス、テクノロジーコンセプト
AIで生成された画像は、実写と比べるとまだクオリティに課題がある部分もありますが、「実在していない」「撮影が極めて困難」なテーマについては、その需要を満たす唯一の選択肢として機能しています。
1. AIならではのトピック(50個)
自動運転都市・ドローン配送・スマートホーム・遠隔医療・医療ウェアラブル・バイオテクノロジー・クリーンエネルギー都市・AI農業・垂直農法・水素エネルギー・宇宙太陽光・海洋風力発電・スマートグリッド・次世代蓄電池・ブロックチェーン取引・フィンテック・量子コンピュータ・交通管制システム・ロボティック警備・多言語翻訳デバイス・AR教育・VR学習・メタバースショッピング・ホログラム接客・次世代通信・衛星インターネット・スマートウェアセキュリティ・ヒューマノイドロボット・エクソスケルトン・遠隔勤務・スマートファッション・サステナブル建築・クリーンエネルギー車両・海洋清掃ロボット・カーボンリサイクル・宇宙旅行・火星コロニー・深海探査・気候変動対策・デジタルツイン都市・コネクテッドカー・スマートライフ・農業ロボット・ハイパーループ・AIアシスタント・スマートウォーター管理・バーチャルイベント・ドローンタクシー・コグニティブマーケティング・サイバーパンク夜景
2. 一般的なストックフォト需要(50個)
ビジネス会議・共同作業・多様性職場・スタートアップ・ワーケーション・インタビュー・オンライン会議・家族団らん・子どもの学習・シニアの暮らし・カップルアウトドア・世界の料理・カフェシーン・ヘルシー食事・フィットネス・旅行・交通手段・自然風景・都市夜景・季節行事・多文化交流・ペット暮らし・DIY・プロダクト撮影・SNSマーケ・電子機器・教育現場・医療現場・美容コスメ・ファッション・エコ活動・スポーツ観戦・結婚式・パーティー・音楽ライブ・リラックス・ボランティア・金融投資・法律契約・フリーランス・ショッピング・レストラン・アート制作・プログラミング・交通安全・ガーデニング・ホテルリゾート・コミュニケーション・健康産業・新生活
3. 人物を含まない需要の高いトピック(50個)
サステナビリティ素材・ミニマルロゴ・メタバース背景・スーパーフード・デジタルアート・未来都市・和モダン・クラフトビール・スマートホーム・季節の花・伝統工芸品・オーガニック食材・環境テクノロジー・抽象的なグラデーション・宇宙空間・マインドフルネス・発酵食品・ワークスペース・SDGs関連アイコン・幾何学模様・ペット用品・カフェドリンク・エコパッケージ・日本の四季・テクノロジーアイコン・建築デザイン・自然テクスチャ・クリプトアート・ウェルネス商品・モダン和菓子・サイバーセキュリティ・古民家・ビジネスアイコン・地方特産品・NFTデザイン・フィンテック・ゼロウェイスト・野菜・果物・アウトドアギア・デジタル通貨・日本庭園・スマートシティ・リサイクル素材・伝統文様・クリーンエネルギー・モダンインテリア・バイオテクノロジー・地域観光・デジタルトランスフォーメーション・和ハーブ
AIツール別の特徴
今回、検証に使用したツール(すべて商業利用可能なモデル)
Flux schnell
Flux 1.1-pro-ultra
Recraft
Leonardo.ai
この記事にはアフィリエイトリンクが含まれています
※Midjourney、Stable Diffusionなど、他にも優れたAI画像生成ツールが存在しますが、今回は大量の画像を効率的に生成するため、APIが利用可能なツールを優先して選定しています。
各ツールの特徴と価格
Flux schnell
高速プレビュー生成に適している
画質:標準的な品質
生成速度:非常に速い
価格:1枚約0.5円($0.003)
$1で約333枚生成可能
用途:プロンプトのテストや方向性の確認
コストが非常に安価(450枚でも約$1.35)なため、まずこのモデルで画像を生成・プロンプトの確認
結果を見て他の高品質モデルでの本制作の判断材料として活用
販売用のストックフォトに採用される事はあまりない
Flux 1.1-pro-ultra
解剖学的な正確さと質感表現に優れる
画質:高品質
生成速度:標準的
価格:1枚約9円($0.06)
$1で約16枚生成可能
用途:人物や複雑なシーンの生成
Recraft
シャープな描写とテキスト表現が得意
画質:鮮明で色彩豊か
生成速度:標準的
人物表現:比較的自然な人物生成が可能
AIっぽさの少ない一般的な人物表現
違和感の少ない表情や姿勢
価格:1枚約3.3円($0.022)
$1で約45枚生成可能
今回は効率を考えてAPIを使用していますがRecraftのサイトでマニュアルで調整しながら作っていくのがお勧め
Leonardo.ai
画質:安定した品質
生成速度:高速
多彩なモデル選択
SD 1.5ベースのモデル
Fluxベースのモデル
Leonardoオリジナルモデル
その他さまざまなモデルに対応
追加機能
動画生成が可能
モデルのファインチューニング
価格:1枚約7.5円($0.05)から
モデルによって価格が異なる
モデルや設定項目が多く、最適な設定の選択に時間がかかる
クレジット制で価格の事前見積もりが難しい
用途:大量生成、効率的な処理、動画コンテンツ制作
プロンプト生成から画像作成まで
今回の検証では、以下のような自動化されたワークフローを構築しました

ChatGPTによるプロンプト生成
スプレッドシートでの管理
Make.comでのプロンプト生成の自動化
Pythonスクリプトによる画像生成の自動化
Googleスプレッドシートからプロンプトの読み込み
各AIツールへの自動送信
生成画像のローカル保存
スプレッドシートへの画像リンクの自動記録
Pythonのコードを実行することで、生成された画像は自動でローカルに保存され、Googleスプレッドシートに画像が今表示されます。
このスプレッドシートで、プロンプトや画像を確認し、修正セレクトをして用途に合わせてAI画像生成のツールを実行していきます。
現在の自動化システム

私自身は、MacのPythonスクリプトを活用して完全自動化システムを構築しています。これにより、4つのAIツールすべての生成からデータ管理まで、ほぼ自動で処理することが可能です。
本記事では、Make.comとLeonardo.aiの連携による基本的な自動化の方法をご紹介しますが、さらなる効率化の可能性を秘めています。
Make.comでのプロンプト生成の自動化
ChatGPTに提案してもらったメインのトピックをスプレッドシートに入力します。

次に、このメイントピックから、Make.comを使用して、AI画像生成のプロンプトを作成します。

ChatGPTでプロンプトを作ると言うシナリオです
ChatGPTの指示の部分は以下
You are an AI assistant specialized in generating stock photography image descriptions. Your task is to create THREE versions of descriptions for each variation based on a given topic.
Topic: {{3.value}}
Before generating the descriptions, please analyze the following aspects:
<image_analysis>
Analyze the topic and list 3-5 key elements that could be visualized
Consider the setting: indoor or outdoor? Urban or rural? Professional or casual?
Think about the main subject(s): person, object, or scene?
Describe the composition: close-up, wide shot, or medium?
Note any current trends in stock photography
Consider the mood or emotion to convey
Identify any symbolism or metaphors
Avoid elements difficult for AI to generate
</image_analysis>
Generate exactly 3 variations using this precise format:
summary_ja: [30文字以内の簡潔な日本語要約]
prompt_ja: [100-150文字の詳細な日本語プロンプト]
prompt_en: [一般的な説明は避け、代わりに照明の種類、物体の配置、視点、特定の芸術スタイルやテーマなど、シーンのあらゆる要素を詳細に説明した英語プロンプト]
[Same format continues]
Format requirements:
Start each variation with a number followed by a period (1., 2., etc.)
Use exact labels: "summary_ja:", "prompt_ja:", "prompt_en:"
Include one blank line between variations
Maintain consistent formatting throughout all variations
そして、Make.comを稼働させます。
およそ20分で150トピック合計450のAI画像生成のプロンプトが作成されました。

これらのワークフローによって、メインのトピックを考えることに集中して、画像生成はほとんど自動で行われ、セレクト、編集に集中できます。
メイントピックは、以前記事で紹介したサイトを参考にして探しています。
有料コンテンツの内容
プロンプトライブラリ
150トピック×3バリエーション(450種)
英語プロンプトと日本語の意訳付き
すぐに使えるcsv形式
生成画像サンプル集
4つのAIツールでの生成例(約1,800枚)
ツール別の特徴比較用データ
商用利用可能な高解像度画像
重要な注意点: 現状のAI画像生成では、人物写真の品質にまだ制限があります。特に人物がアクションをしている シーンでは、ほとんどの画像が修正なしでの商用利用は難しい品質です。シンプルなポートレート 以外の人物画像については、AIの技術向上を待つことをお勧めします。
Make.comのシナリオ(2種)
プロンプト自動生成システム
プロンプトからLeonardo.AIを使った自動画像生成
※ 本記事で紹介したMacでのPythonスクリプトを使用した完全自動化システム(画像生成の自動化やGoogleスプレッドシートへの画像貼り付けなど)は含まれていません。
必要な準備
基本(コンテンツの閲覧・参照用)
Googleアカウント
ご自身でプロンプト作成、画像生成を行う場合の追加準備
Make.comアカウント
1000オペレーションまで無料
プロンプト、画像自動生成に使用
ChatGPT APIキー
450プロンプト生成で約$3
プロンプト自動生成に必要
Leonardo.ai APIキー
9ドルで3,500クレジット
約160枚の画像生成が可能
ここから先は有料コンテンツとなります。上記リソースへのアクセス方法と詳細な設定手順をご覧いただけます。
ここから先は
¥ 5,000
この記事が気に入ったらチップで応援してみませんか?