Googleの新サービス「Whisk」で画像を混ぜ混ぜしてみる

2025年2月13日 00:13

はい、どっこいしょ。MISAです。
ImageFXの親戚と言いますか、兄弟といいますか。Googleの新しい生成AIがリリースされました。以下から無料で利用できます↓

ざっくり言うと、画像と画像を混ぜて新しい画像を生成しよう！て感じです。felo君に説明してもらいました↓

GoogleのWhiskは、画像をプロンプトとして使用して新しい画像を生成する革新的なAIツールです。このツールは、従来のテキストベースのプロンプトに代わり、ユーザーが画像をアップロードすることで、より直感的にクリエイティブなビジュアルを作成できることを特徴としています。

Whiskの主な特徴

画像入力による生成: Whiskでは、ユーザーが「被写体（Subject）」「シーン（Scene）」「スタイル（Style）」の3つのカテゴリにそれぞれ画像をドラッグ＆ドロップすることで、新しい画像を生成します。このプロセスは、AIが各画像の特徴を解析し、独自の新しい画像を作り出すことを可能にします。
自動キャプション生成: Whiskは、GoogleのAIモデル「Gemini」を使用して、入力された画像の詳細なキャプションを自動的に生成します。このキャプションは、画像生成モデル「Imagen 3」に入力され、最終的な画像が生成されます。
簡単な操作性: ユーザーは、複雑なテキストプロンプトを考える必要がなく、画像を選択するだけで簡単に始められます。これにより、特にテキストによる指示が苦手な人々にとっても、クリエイティブな表現がしやすくなっています。
利用可能な地域: Whiskは、アメリカを含む100以上の国で利用可能ですが、一部の国や地域（インド、EU、UKなど）では利用できないことに注意が必要です。