
【画像生成AI】Whiskとは?初心者のための解説
Whiskとは?
Whisk(ウィスク)は、Googleが開発した最新の画像生成AIツールです。従来の画像生成AIがテキストプロンプトを必要とするのに対し、Whiskは画像をプロンプトとして使用することで、直感的に新しい画像を作成できるのが特徴です。
Whiskの特徴
画像を使ったプロンプト
被写体(Subject)、シーン(Scene)、スタイル(Style)の3つのカテゴリに画像を設定。
それらを組み合わせて、新しい画像を生成。
AIによる自動キャプション生成
GoogleのAI基盤モデル「Gemini」が入力画像を解析し、詳細なキャプションを自動作成。
そのキャプションをもとに、画像生成モデル「Imagen 3」が新しい画像を生成。
クリエイティブなリミックス
細かい編集ではなく、アイデアの探索やクリエイティブなビジュアル制作に最適。
Whiskの使い方(初心者向け)
Whiskのサイトにアクセス
Google Labsの公式サイトから利用可能(日本を含む100以上の国で展開中)。
画像をアップロード
被写体・シーン・スタイルごとに画像を選択。
AIが自動解析
Geminiが画像のキャプションを作成。
生成された画像を確認・調整
生成された画像をダウンロード、または再生成。
こんな人におすすめ!
テキストプロンプトが苦手な人。
既存の画像を活用して新しいデザインを作りたい人。
直感的な操作でクリエイティブなビジュアルを作りたい人。
まとめ
Whiskは、画像を元に新しいビジュアルを直感的に生成できるAIツールです。従来のテキストベースの画像生成AIとは異なり、クリエイティブなリミックスを楽しめる点が魅力です。初心者でも簡単に使えるので、ぜひ試してみましょう!