見出し画像

Googleの新サービス「Whisk」で画像を混ぜ混ぜしてみる

はい、どっこいしょ。MISAです。
ImageFXの親戚と言いますか、兄弟といいますか。Googleの新しい生成AIがリリースされました。以下から無料で利用できます↓

ざっくり言うと、画像と画像を混ぜて新しい画像を生成しよう!て感じです。felo君に説明してもらいました↓

GoogleのWhiskは、画像をプロンプトとして使用して新しい画像を生成する革新的なAIツールです。このツールは、従来のテキストベースのプロンプトに代わり、ユーザーが画像をアップロードすることで、より直感的にクリエイティブなビジュアルを作成できることを特徴としています。

Whiskの主な特徴

  • 画像入力による生成: Whiskでは、ユーザーが「被写体(Subject)」「シーン(Scene)」「スタイル(Style)」の3つのカテゴリにそれぞれ画像をドラッグ&ドロップすることで、新しい画像を生成します。このプロセスは、AIが各画像の特徴を解析し、独自の新しい画像を作り出すことを可能にします。

  • 自動キャプション生成: Whiskは、GoogleのAIモデル「Gemini」を使用して、入力された画像の詳細なキャプションを自動的に生成します。このキャプションは、画像生成モデル「Imagen 3」に入力され、最終的な画像が生成されます。

  • 簡単な操作性: ユーザーは、複雑なテキストプロンプトを考える必要がなく、画像を選択するだけで簡単に始められます。これにより、特にテキストによる指示が苦手な人々にとっても、クリエイティブな表現がしやすくなっています。

  • 利用可能な地域: Whiskは、アメリカを含む100以上の国で利用可能ですが、一部の国や地域(インド、EU、UKなど)では利用できないことに注意が必要です。

まとめ

Whiskは、画像を使って新しいビジュアルを生成するための新しいアプローチを提供するAIツールです。直感的な操作で、ユーザーは自分のアイデアを簡単に具現化できるため、クリエイティブなプロジェクトにおいて非常に便利なツールとなっています。

はい、いつもありがとうございます。

では早速使ってみましょう。アクセスするとこんな画面になっていて、モデルのところになんでもいいので画像をUPしてみましょう。すると合成が始まります。


テンプレートで「チョコレート」が選択されているので、チョコレート風の画像が生成されるかと思います。以下サンプルです。


結構可愛いですよねw
テンプレートを全部試してみます。

〇ぬいぐるみ

〇カード

〇ピンバッチ


〇カプセルトイ


〇お弁当


健全な遊びとしては有りだと思います。
普通に可愛いですよね。


さて「画像を混ぜよう!」と言われたらやっぱり人と人や、人と動物なんかを混ぜてみたいですよね?しかし今のところうまくいかないですね…アニメ化&単純に二人が並ぶだけです。二人の特徴を合体して一人を生成とはならないです。また、人面犬みたいなのもできないぽいんです。



上記2つの画像を混ぜたものが以下です↓



うーん、ちょっとやりたいことと違うなあて感じです。各自の特徴を混ぜ合わせて一人になるわけではないんですよね。あと画像を読み込ませて、プロンプトでポーズを指定してもあまり言うことを聞かない印象です。ということで、被写体同士の「合体」だったり、被写体の「ポーズ等の変更」はイマイチというのが現状です。

もしうまくいった人がいましたら記事のコメントやXで教えてくれると嬉しいです。それではまた~

いいなと思ったら応援しよう!