見出し画像

#101【文字入り画像生成】GoogleのIMAGE FXで痒い所に手が届いた

おはようございます。



アナログな企業で生成AI普及を目論む3年目社員アヒルです。今年すでに4回鼻に虫が入った不運な人間です。


Googleの画像生成AIが個人的に過去一のクオリティだと思ったので、今日はこちらを紹介します。


IMAGE FXとは?


ImageFXは、Googleが提供する無料の画像生成AIツールで、テキストから高品質な画像を生成することができます。
画像だけでなく音楽や動画も生成できるようですが、今回は画像に焦点を当てます。

主な特徴は以下の通りです。

  • Imagen 2モデルを使用し、高画質、ハイレベルな画像を短時間で生成可能。

  • プロンプトの自動選択や並び替えができ、簡単に操作できる。

  • ユーザーが生成した画像のバリエーションが複数表示され、好みのものを選択できる。

  • 生成された画像には、AI生成であることを示す電子透かし"SynthID"が埋め込まれる。

  • Googleアカウントを持っていれば無料でアクセスできる。


使い方




下記にアクセスし、Googleアカウントでログインします。


このような画面が出てきます。

日本語のプロンプトではうまくいかなかったので、英語に翻訳してから与えてみました。

ChatGPTに考えてもらった
「アヒルのあみぐるみが小さなエプロンを着けて、カフェのカウンターでバリスタとして働くシーン。コーヒー豆を一生懸命に挽いたり、泡立てたミルクをうまく注げずに泡だらけになったりする姿がコミカルです。」


早速気になる動きが。
表現力チップなどと呼ばれる枠を選択すると、別の選択肢を提案してくれます。

今回はこのまま、"♦︎作成"を押します。

すると、かなり高画質なバリスタアヒルが生成されました。
指示にあった通り、ミルクの泡をこぼすといったおっちょこちょいも披露しています。


もう一つ気になったのが、
"もっと作成"の下のバリエーションです。

抽象的や手作り感のある、のような画像の雰囲気を選択できます。

よりによって35mmフィルム風というよくわかんないものを選んでしまったので、
よくわからないけど35mm風のアヒルが生成されました。


文字を入れさせてみた



このモデル、どうやら文字もしっかり画像に組み入れてくれるらしいので、
先ほどの画像に追加指示で「ラテアートで"DUCK"と描いてる様子」と伝えたところ、

見事違和感なく文字を入れてくれました。
でもまぁ、4文字くらいがんばれば他のAIモデルでもできるだろと思い、


長文与えてみた。

"If it looks like a duck, swims like a duck, and quacks like a duck, then it probably is a duck."

アヒルが出てくる英語の諺おしえてとChatGPTに聞いたところ教えてくれた諺です。

直訳すると、"アヒルのように見え、アヒルのように泳ぎ、アヒルのように鳴く場合、それはおそらくアヒルです"という意味。なんだそら。


意訳すると、"なんかだいたいソレっぽいんだったらもうソレはきっとソレだよ"って感じですかね。


脱線しましたが、

ChatGPTの画像生成と同じように、Image FXでもその場で画像を編集することができます。

ブラシで編集したい部分を塗りつぶし、変更内容を記入して再生成します。


クチバシをモノクロにしてって言ったんですけど、ビミョ〜になんか言いたげな口元に変えられて終わりました。

4枚目ぜったい何か言ってる


プロンプトの工夫はまだまだ必要みたいです。



まとめ


Image FXの存在を知ったのが最近だったので(ずっとGeminiチャット画面で画像生成できるようになると思ってた)、もっと早く知りたかったなぁというのが正直なところです。

自分的には文字入りの画像を作れるというのがポイント高かったです。
また、たくさんアヒルが登場しましたが別にアヒルが好きなわけではありません。


お読みいただきありがとうございました!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?