Gemini版画像生成AI Imagen3がリリース！でも...

2024年9月6日 09:28

さて、話題になったImagenFXがついにGeminiで使えるようになりました（正確に言うと、やっと日本で使えるようになったんです）。前まではGoogleのAIプラットフォームであるImageFXでImagen3を使っている方が多かったんじゃないでしょうか？
以下の記事でImagen3がバズった理由について考察しています。

でも、GeminiでImagen3を使うとImageFXと何が違うんでしょう？一緒に見ていきましょう。

GeminiにおけるImagen3

今朝、Geminiを開いたら、こんな画面が出ていました。

まずは機能について聞いてみました。

うーん、この返事。Gemini Advancedを課金している方なら「またか」と納得するかもしれませんね。Gemini Advancedの謎の検閲。
質問を変えてみましょう。「あなたの画像生成機能について教えてください。」で聞いてみました。

私の画像生成機能は、現在 Google の最新の画像生成モデルである Imagen 3 を利用しています。これにより、テキストによる指示から高品質で多様な画像を生成することが可能です。

主な機能:

テキストから画像生成: 具体的な指示や抽象的な概念、またはその組み合わせから、創造的でリアルな画像を生成します。
画像編集: 既存の画像をアップロードし、テキストによる指示で編集を加えることができます。例えば、オブジェクトの追加、削除、色の変更などが可能です。
スタイル転送: ある画像のスタイルを別の画像に適用し、独特な雰囲気を持つ画像を作成できます。
高解像度生成: 必要に応じて、高解像度な画像を生成することも可能です。
人物画像生成について:

以前は一時的に停止されていましたが、人物画像生成機能も間もなく再開される予定です。この機能は有料ユーザー向けとなります。

制限事項:

不適切なコンテンツの生成: 暴力的な表現、ヘイトスピーチ、性的コンテンツなど、不適切な内容の画像生成はできません。
著作権侵害: 著作権で保護されたコンテンツの複製や模倣となる画像生成はできません。
倫理的な配慮: 人種、性別、宗教など、特定のグループに対する差別や偏見を助長する画像生成はできません。
利用方法:

画像生成機能は、テキスト入力欄に「/imagine」と入力し、その後に生成したい画像の内容を記述することで利用できます。より具体的な指示や詳細な説明を加えることで、希望に沿った画像が生成されやすくなります。

例:

/imagine 夕焼けに染まる富士山
/imagine サイバーパンクな東京の街並み
/imagine 猫が毛糸玉で遊んでいる写真
注意点:

生成された画像は、あくまでAIによって生成されたものであり、現実とは異なる場合があります。
生成された画像の利用については、関連法規や倫理的な配慮を遵守してください。
今後の展望:

画像生成機能は今後もさらに進化し、より高品質で多様な画像生成が可能になることが期待されます。また、新たな機能の追加や、より高度な編集機能の実装も予定されています。

フィードバック:

画像生成機能に関するご意見やご要望がありましたら、お気軽にお寄せください。ユーザーからのフィードバックは、今後の開発に役立てられます。

免責事項:

画像生成機能は、実験的な機能であり、予告なく変更または終了する場合があります。
生成された画像の品質や内容については、一切の保証をいたしかねます。
生成された画像の利用によって生じた損害については、一切の責任を負いかねます。
最後に:

画像生成機能は、創造性を刺激し、新たなアイデアを生み出すための強力なツールです。ぜひ様々な指示を試してみて、あなたの想像力を解き放ってください。

何か質問があれば、お気軽にどうぞ！

おっ、なんだか詳しく教えてくれましたね。
でも、気になるところが二点。人物の画像を生成できるのか？そして、/imageコマンドを使う必要があるのか？

風景を生成してみた

まずは例で出ているプロンプトをそのまま使ってみましょう。
/imageを入力すると、富士山の画像を生成してくれました。

/imageなしでそのまま「生成してください」と聞いても、ちゃんと生成してくれるようになったこと。

/imageを使った場合は他のパラメータで細かく制御できるのかな？

現在、/imagine コマンドで直接利用できるパラメータはありません。しかし、プロンプトの中に特定のキーワードやフレーズを含めることで、生成される画像をある程度制御できます。以下に、よく使われるキーワードやフレーズとその効果をまとめました。

スタイルに関するキーワード:

アートスタイル:
"油絵風"、"水彩画風"、"鉛筆画風"、"ピクセルアート風"、"浮世絵風" など
時代:
"ルネサンス期"、"バロック期"、"印象派"、"アール・ヌーヴォー"、"ポップアート" など
雰囲気:
"夢のような"、"幻想的な"、"ダークな"、"明るい"、"レトロな" など
その他:
"写真のような"、"詳細な"、"シンプルな"、"抽象的な" など
構図に関するキーワード:

視点:
"鳥瞰図"、"俯瞰図"、"クローズアップ"、"遠景" など
構図:
"黄金比"、"日の丸構図"、"三分割構図"、"対角線構図" など
照明:
"逆光"、"サイド光"、"スポットライト"、"自然光" など
その他:

解像度:
"高解像度"、"4K" など（ただし、高解像度画像は生成に時間がかかる場合があります）
色:
"鮮やかな"、"パステル調の"、"モノクロの" など
例:

/imagine 鮮やかな油絵風のひまわり畑
/imagine レトロな雰囲気の東京の街並み、ピクセルアート風
/imagine クローズアップで撮影された、露に濡れたバラの花、写真のような
注意点:

これらのキーワードやフレーズは、あくまで画像生成のヒントであり、必ずしも意図した通りの結果になるとは限りません。
キーワードやフレーズを組み合わせることで、より複雑な表現が可能になりますが、多すぎるとAIが混乱する可能性があります。
今後のアップデートで、より直接的なパラメータ制御が可能になる可能性があります。
最後に:

これらのキーワードやフレーズを参考に、様々なプロンプトを試してみてください。あなたの創造性を最大限に引き出し、素晴らしい画像を生成できることを願っています。

何か質問があれば、お気軽にどうぞ！

本人に聞いてみたら、/imageコマンドはまだパラメータに対応していないらしく、制御したかったらそのままプロンプトを書くとのこと。Midjourneyみたいに-ar 16:10を書く必要がないです。
ImageFXも同じ仕様だったので、そんなに違和感がないですが。であれば、わざわざ/imageを使う必要がなく、そのまま聞けば良さそうです。

人物を生成できるか？

さて、一番気になる人物生成。「日本の女子高生のイラストを生成」で聞いてみたら...

やっぱりダメでした。

/imageで英語を使っても、同じ結果。他に数パターン試してみましたが、人物そのものだけでなく、人物が出そうな画像（例えば砂浜とか）も生成してくれません。
なんと残念な仕様...。

まとめ

正直、人物がリアルというImagen3の最大の強みを生かせない以上、今のところわざわざGeminiを使う理由はないです。
もしかしたら近いうちに、Geminiでも人物画像に対応するかもしれません。
GrokのFluxがバズったので、それへの対抗意識で急いでリリースしたかもしれません（笑）。
Grokは検閲が緩いことでバズったので、Googleは全くその逆の路線というのも面白いところですね。

#生成AI
#AIとやってみた
 #Claude
#ChatGPT
#Gemini
#プロンプト
 #プロンプトエンジニアリング
 #AI創作
 #AIライティング
 #Imagen3
#画像生成AI
#GoogleAI

いいなと思ったら応援しよう！

この記事が参加している募集

#AIとやってみた

47,519件