見出し画像

生成AI News -【Google新AI】画像をポンっと入れるだけ🎨✨「Whisk」で直感的に生成しよう!

こんばんは、りょぶんです。

完全に見落としてましたが、Googleより面白い画像生成AIがお試し版としてリリースされていました😓
簡単に画像が作れるので、ぜひ試して見てください。

私も試してみましたが(記事の最後に画像あり)、生成したようなものが本当にあったら、買ってみたくなってしまいました🥰


Googleの新しい画像生成AI「Whisk」とは

Googleが開発した「Whisk」は、画像を入力するだけで新たなビジュアルを生成する革新的なAIツールです。従来のテキストベースのプロンプトではなく、ユーザーが選んだ画像を組み合わせて、直感的に新しい画像を作成できます。2025年2月12日から、日本を含む100以上の国と地域で試験運用が開始されました。 (Google ブログ)

Whiskの特徴と機能

画像をプロンプトとして活用

Whiskでは、詳細なテキスト入力を必要とせず、画像をプロンプトとして使用します。ユーザーは「モデル(被写体)」「シーン(背景)」「スタイル」の3つの要素にそれぞれ画像を入力し、これらを組み合わせてオリジナルの画像を生成できます。例えば、特定のキャラクターをカプセルトイ風にデザインすることも可能です。 (Google ブログ)

日本向けのテンプレートを追加

日本での提供開始に合わせて、「カプセルトイ」や「お弁当」といった日本文化にインスパイアされた新しいテンプレートが追加されました。これにより、日本のユーザーも親しみやすく、独自の文化を反映した画像生成が可能となっています。 (Google ブログ)

GeminiとImagen 3の連携による高精度な画像生成

Whiskのシステムでは、Googleの大規模AIモデル「Gemini」が入力された画像の詳細なキャプション(説明文)を自動的に作成し、その説明を最新の画像生成モデル「Imagen 3」に入力します。このプロセスにより、入力画像の本質を捉えた新しい画像を生成できます。 (Google ブログ)

Whiskの利用方法と注意点

簡単な操作で画像生成

Whiskの利用は非常に簡単で、ユーザーは生成したい画像の「モデル」「シーン」「スタイル」の3つの要素に対応する画像をドラッグ&ドロップするだけで、新しい画像を生成できます。また、テキストで補足説明を加えることで、より詳細な指示を与えることも可能です。 (AI総研)

英語でのプロンプト使用の推奨

一部の機能を最大限に活用するためには、英語でのプロンプト使用が推奨されています。これは、英語での入力がより正確な画像生成につながるためです。 (Google ブログ)

生成される画像の特徴と注意点

Whiskは、入力された画像の重要な特徴を抽出して新しい画像を生成しますが、必ずしも元の画像を正確に再現するわけではありません。例えば、生成されたモデルの身長や髪型、肌の色が元の画像と異なる場合があります。ユーザーが期待する結果と異なる場合には、基となるプロンプトを表示・編集して調整することが可能です。 (Google ブログ)

まとめ

「Whisk」は、画像をプロンプトとして活用し、直感的かつ簡単に新しいビジュアルを生成できる革新的なAIツールです。日本向けのテンプレートも追加され、多様なニーズに応えることができます。ぜひWhiskを活用して、創造的なアイデアを形にしてみてください。 (Google ブログ)

お試し画像

ログイン後の画面
生成後の画面-カプセルトイ
生成後の画面-お弁当
生成後の画面-ぬいぐるみ


ご覧いただき、ありがとうございました🥰

いいなと思ったら応援しよう!

りょぶん🎈
よろしければサポートお願いします😊いただいたサポートは文鳥の記事であれば豆苗🥬に、その他は資格の本の費用📖に使わせていただきます🙇‍♂️

この記事が参加している募集