Geminiに画像生成機能が搭載 - 簡単!Geminiで画像やイラストを生成する
はじめに
アカウントさえ持っていれば基本無料で使える話題のチャット型AIのGemini。今まではGeminiでは画像を読み込ませてその内容についての処理はできましたが、画像生成機能はありませんでした。
そして遂に今年の10月頭に画像生成機能が搭載されました。今までが画像生成はサードパーティー製AIを開かなかなければなりませんでしたが、Geminiで完結できるようになったわけです。
そこで今回はGoogleの生成AIのGeminiを使った画像生成のやり方を紹介します。
Geminiとは?
まずはGeminiについて軽く復習しておきます。
Geminiは、Google AIによって開発された大規模言語モデルです。Geminiは、テキスト、コード、画像など、さまざまな形式の情報を理解し、生成することができます。従来のモデルよりも高度な能力を持ち、より自然で人間らしい対話が可能となっています。また、画像生成モデルのimagen3を使用して、画像生成にも対応しています。
imagen3とは?
次にimagen3について軽く触れておきます。
Imagen 3は、Google Researchによって開発された、大規模な画像生成モデルです。テキストの説明から高品質な画像を生成することができます。imagen3は高画質、多様なスタイル、テキストに忠実性があることが特徴です。
導入する
Geminiで画像生成する方法です。以下の手順で導入出来ます。
まずは、いつも通りGoogleのホーム画面から[Gemini]を呼び出します。
初めて起動するとimagen3の紹介画面が出てきますので、[完了]を押してください。導入自体はこれだけです。
画像やイラストを生成してほしい時は、プロンプトで「~の画像を生成してください。」や「~のイラストを生成してください。」と書き込むだけで自動で画像生成が始まるようになります。
実際に生成してみよう!
早速画像を生成してみましょう。
生成する画像のテーマは可愛い猫が見たい気分ですのでプロンプトに
「かわいい猫がふわふわの雲の上で虹をみている水彩画」と指定してみました。その後10秒程度で画像が出力されます。
可愛らしい猫の画像が出力されました!
しかし、不自然に胴体より下が無く、こけしみたいになってしまいました。また、Geminiから画像生成のプロンプトのコツが提示されています。
「説明が具体的であるほど」というアドバイスが提示されたので、プロンプトをもっと具体的に修正してみます。
修正前:「かわいい猫がふわふわの雲の上で虹をみている水彩画」
修正後:「かわいいスコティッシュフォールドの子猫がふわふわの雲の上で頭上の虹をみている、暖かく幻想的でゆったりとした時間がながれる水彩画」
この内容で再度リクエストしてみました。
全身が描画されたことにより不自然さが無くなり、可愛さもアップしました。このようにプロンプトで細かく指定すれば、改善される事もわかりました。
英語プロンプトを試してみる
過去の記事で、ブログのヘッダー画像を生成する記事を紹介していました。そこで使用していたプロンプトをGeminiにリクエストするとそのような画像が出るのかが気になったので試してみました。
比較する過去記事はこちらから↓
使用するプロンプトは最後の「super fine illustration, best quality, red~」というプロンプトを使用しました。
シンプルなヘッダー画像が生成されました。リートンAI(SD3)とは全く違ったスタイルです。生成モデルが違えば出力されるスタイルも大きく違うということが伺えます。
まとめ
今回はGeminiでの画像生成導入から生成までを紹介致しました。導入と言いましても[完了]ボタンを押すだけで使用が可能になりますので、とりあえず画像生成初心者にも簡単に画像生成を試すきっかけになればと思います。
また、プロンプトは具体的に指定するだけで描画精度があがります。イメージに対して具体的なモノや形を指定することが生成のコツです。もちろんチャット形式ですので、Geminiと対話形式でイメージを具体化する用途でも使用できます。
是非ご活用ください。
おしらせ
電巧社ではセキュリティ分野専門のブログも公開しています。ゼロトラストセキュリティを始めとした、ランサムウェアへの対処法等を紹介しています。こちらもよろしくお願いします。