【Imagen3】Geminiで画像を生成する方法
[読了目安: 2分]
AI系ポッドキャスト(耳で学ぶAI)を運営している矢野哲平(@robothink_jp)です。
実はGoogleが提供する生成AIのGeminiで画像生成もできます。Imagen3という画像モデルが使われているんですね。この記事ではGeminiを使って画像生成をする方法を解説します。
👨💻対象読者
Geminiで画像生成したい
Geminiの画像生成のやり方を知りたい
🎉記事を読むとできること
Geminiで画像生成ができる
注意点
いずれも、「現状」という前置きが付きますが、Geminiで画像生成をするには下記の制限に注意しましょう。
人物画像の生成は無料版ではできない
日本語プロンプトの注意点
アスペクト比の指定はできない
この中でアスペクト比の指定に関してはGemini上ではできませんがImageFXではできるようになっています。詳しくは後述します。
注意点1️⃣: 無料版では人物画像の生成はできない
これですね、以前は生成出来ていたんですよ?リリース当初はこんな感じで人物の画像生成が出来ていました。
しかし、現状は無料版での人物画像生成はストップされています。背景として人物の画像生成で起こるハルシネーションに批判が集中したためです。
その後、Gemini有料版では人物画像の生成ができるようになっています。
ちなみに人物以外の生成は無料版、有料版でも可能です。
Imagen3を試したい人はGeminiのチャット画面から指示すると画像生成してくれます。
注意点2️⃣: 日本語プロンプトの注意点
Geminiで画像生成する場合は英語プロンプト推奨です。
なぜなら日本語プロンプトでは人物画像の生成ができないからです。
「まもなく Gemini Advanced で人物の画像生成を利用できるようになります。」👈こんなエラーが出ます
有料版に加入したのに人物画像生成できない!という人はプロンプトを確認してください。もし日本語プロンプトで指示していればそれが原因です。
基本的なプロンプトのフォーマットはこんな感じ。明示的に画像生成したいことをプロンプトに含めれば画像生成してくれます。
Generate the following image
"""
(画像の説明)
"""
注意点3️⃣: アスペクト比の指定はできない
(現状)アスペクト比の指定ができない点にも注意しましょう。アスペクト比、つまり縦横の比率が指定できません。生成される画像は正方形のみです。
ただし、冒頭で説明したようにImageFXではできるようになっています。
ImageFXはgoogleが提供する画像生成ツール。内部では同じくImagen3のモデルが動いています。
Geminiで画像を生成する方法
さっそくGeminiで画像を生成してみましょう。
やり方はいたってシンプルです。プロンプトで画像を生成してとGeminiのチャット画面に英語で指示するだけです。もちろん日本語でも機能しますが、英語の方が良い結果を得やすいので私は英語で指示しています。Google翻訳などのツールを使うと簡単に英語プロンプトを作成できます。
例として、レストランのテーブルの上に置かれているパスタとワインを描くように指示します。
Drawing photorealistic images.
Background is a restaurant.
Pasta and wine on a white tablecloth.
生成した画像をダウンロードする
生成した画像にカーソルを合わせればダウンロード可能です。
生成後に会話を重ねる
画像生成後に会話を重ねて画像を修正できます。
先ほどの画像では赤ワインが生成されていました。これをシャンパンに変えてみましょう。
Change the wine at the table to champagne.
うまく機能していますね!ちなみに会話を重ねる時も英語となります。
興味のある方はぜひ試してみてください✌️
【note読者限定】生成AIのおすすめツールの資料を配布中
生成AIツールは何を使えばいいか分からない
もっと業務効率化に貢献するツールを知りたい
ChatGPT以外のAIツールを知りたい
こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。もっとAIの情報をキャッチアップしたい人はぜひご覧ください。
👉資料を受け取る
noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼