見出し画像

え、これAIなの⁉️😳リアルすぎてやばい…画像生成AI・Google「Imagen 3」「Whisk」💖無料で使えるって本当?特徴や使い方、日本からのアクセス方法まで、気になる情報満載でお届けします✨

Googleの最新技術、Imagen 3とWhisk

どうも皆さん!美容院で「今日の髪型どうですか?」って聞かれて、見えてない後ろ姿まで「バッチリです!」って答えちゃう、葉加瀬あい(ハカセアイ) です!

ということで、今回はGoogleの最新技術である Imagen 3Whisk について解説をしていきます。

どちらも最新の、本当にすごい綺麗な画像が作れたり、日本人の画像がすごいリアルに作れたりするものになりまして⋯。

少し工夫が必要ですが、無料で使えるんです!今話題のGoogleの最新テクノロジーについて、さっそく見ていきましょう!

画像生成AI「Imagen 3」とは?

まず最初に軽くだけ説明します!

Imagen 3 は、Googleが開発した最新の画像生成AIです。

正直、Midjourneyなどと比べても全然遜色ないですし、ウェブ操作だけでこれだけのリアルな画像が作れるのは本当に素晴らしいです!

画像の特徴を反映できる「Whisk」とは?

そして、同じくGoogleの新技術であるこちらの Whisk も、無料で使えるものになるんですけども⋯。こんな感じで複数の画像の特徴を、生成画像に反映したり、というのができる本当にすごい技術なんです!

Google Imagen 3とWhiskとは?概要をチェック!

というわけで、今回は、まず ①GoogleのImageGen 3とWhiskのそれぞれの概要 と、 Whiskを使った方がいい理由 を解説します。

そして、その後に ②Whiskの使い方 を解説していきます!

現在はアメリカからしか使えないんですけども、日本からでも使用する方法や、Whiskがうまく使えないときの代替手段なども一緒に解説をしていきたいと思います⋯!

ディープフェイクと関連技術、そしてVeoの最新情報について

それから最後に ③顔の交換方法 や、 Google の動画生成 AI Veo 2 の最新情報など、そういった関連技術についても解説をしていきます!

GoogleのImagen 3やWhiskは、とっても綺麗な画像を生成できるんですけども、顔の一貫性を保持するのはまだ技術的に苦手みたいです⋯。

ですので、 フェイススワップ という技術を使って、指定した顔の画像に交換するといったことをやっていきたいと思います!

イメージとしては、こんな感じで対象の画像のマスク画像を作成して、そこの部分をAIで指定した顔の特徴を使って再生成するといった形ですね!

メンバーシップ特典と最新情報のお知らせ

そして、私の メンバーシップ にご参加されている方は、いつものように記事内容を 動画 でご覧いただけます!

こちらのURLからご覧ください!

https://note.com/ai_hakase/n/n7e6aaf0ea499

それと、英語版(ベータ版)もお届けしています!

最新のAI技術を学びながら 英語学習も一緒に進めたい方は、こちらのURLからご覧ください!

https://note.com/ai_hakase/n/n808dba9f181c

それから、Noteのメンバーシップ の参加者さんには 質問対応 なども行っていますので、感想や質問などありましたら、できれば Xのリプライ で教えてください!

XのDM や Noteのコメント でも大丈夫です!

質問対応について

質問対応についてご案内いたします!質問がある場合、 「NoteのID」と「質問したいNote記事のURL」 を添えてご連絡くださいませ。

Xへのリプライ、またはDMでも大丈夫です。Noteのコメント欄でも問題ありません⋯!

https://x.com/ai_hakase_

それでは、本日もよろしくお願いします!


Googleの最新技術!Imagen 3とWhisper

そうしましたら、早速 Googleの最新技術「Imagen 3」と「Whisper」 の概要から入っていきますね⋯!

Imagen 3とは?

まずはじめに、 Imagen 3 からご説明をいたします。

それで、Imagen 3って何なのかについて、簡単にご説明をしておきます!簡単に言うと、Googleが開発した 最新の画像生成AI です⋯!

すごくリアルで、AIかどうかわからないような画像が作れる、最先端の画像生成AIになります。

こちらの外国人の方の画像をご覧いただくと、よりわかりやすいのではないかと思います!

https://tinyurl.com/2yf8g5q5

Imagen 3の驚くべき描写力⋯!プロンプトへの忠実性と日本人女性の表現

それと、 プロンプトにもすごく忠実 というのと、あとは日本人女性とかアジア人女性とか、すごい本当にリアルに画像生成してくれるんです⋯!

日本人女性の表現と、それをとりまく文化への理解

結構こういうのって「日本人」っていうと、和服を着た、お寺にいる女性とかを出したりすることが多いんです。

けど、そういうところもちゃんと考えて画像生成してくれるのが、すごいですね⋯!

というか、もうこういう人、本当にいそうですよね⋯!

男性もリアルに生成!その高い性能

他にも、こんな感じで男性もすごいリアルに生成できます⋯!

https://is.gd/GY9INP

水中で動く猫も生成可能?非現実的なシーンにも挑戦

水中で動く猫ちゃん など、非現実的そうなものでも生成できます⋯!
とても面白いですよね。
以下が、その画像になります。

https://is.gd/GY9INP

アジア人系の画像生成は得意、しかし文字は苦手?

ただし、アジア人系の画像生成はとても上手なのですが、文字はまだ苦手のようです⋯。
もし生成するなら、文字は表示させないようにするのが良いかと思います!

Googleが発表した最新の画像生成AI「Whisk」とは?

次が Whisk の概要です!こちらについて説明していきます!

この技術、なんと 「主題」、「シーン」、「スタイル」 の3つの異なる画像から、新しい画像を生成することができるんです⋯!
「いったい、どういうこと⋯?」と思う方もいらっしゃるのではないでしょうか。

Whiskで出来ること

たとえば、ある人物の写真、美しい風景の写真、そして特定の画風の絵画の画像を組み合わせることで⋯

それらの要素を組み合わせた全く新しい画像を、驚くほど簡単に作り出すことが可能なんです!

しかも現在は テスト版 ということで 完全に無料 で利用できるみたいなので、これはもう使わない手はないです!

https://da.gd/SlbXCt

Whiskの仕組みについて

もう少し具体的にWhiskというのが何なのかと言いますとですね⋯

内部的には Imagen3 を使っている画像生成AIのツールになるんですけども、こんな感じで、テーマとかシーンとかスタイルとか、決めてあげてプロンプトを打ち込んで、画像生成をしてあげるとこのテーマに即した、画像が作られるっていう感じです!

この3つの画像とか2つの画像とかをそれぞれ組み合わせて画像生成ができるっていう感じのものになっています。

Whiskで生成できる画像の例

こちらのように幻想的なお魚さんとかも描いたりできるみたいです。

あとは、可愛らしいセイウチです!
もともとの画像はちょっとドラマスティックなイメージなんですけども、それがこんな感じに綺麗になります。

他の例としては、このような感じです!幻想的な世界が広がっています⋯!

https://da.gd/CRr7a

プロンプトの理解力の高さ⋯Whiskの実力!

ちなみにプロンプトの理解力についてなんですけれども、この「 Whisk 」は、理解力が高く、画像の組み合わせがとても自然で、成功率も高いとのことです!素晴らしいですね⋯。

https://tinyurl.com/2xmhm492

自然な融合⋯Whiskの技術力!

ここに関しては、公式の発表でも「 Prompt less. 」という言葉が強調されているように、本当に詳細なプロンプトを入力する必要がないとのことです!

これって、画像生成AIの利用のハードルを大きく下げてくれる、画期的な機能ではないでしょうか?

しかも、「 Whisk 」のすごいところは、ただ要素を混ぜ合わせるだけではなくて⋯各部分の情報をうまく抽出して、それらを 自然に融合 させてくれるんです。

つまり、それぞれの画像の特徴が互いに干渉し合うことなく、調和の取れた1枚の画像を生み出してくれます!本当にすごいです⋯!

IP-AdapterとWhiskの関係性について

ご存知の方ですと、 IP-Adapter という技術と少し似ていると思われるかもしれませんね⋯!

IP-Adapterは、画像生成において非常に注目されている技術です。
「似ているかも?」と疑問を持った方、するどいです⋯!

https://tinyurl.com/29dkerst

ちなみに私事なんですけども、テスラのロゴをモチーフにした、こちらのぬいぐるみ画像、とっても可愛いですよね⋯!
私も個人的にすごく好きです!

https://da.gd/c8iZG

ユーザーインターフェースについて

それで先ほどもご説明した通り、Whiskのユーザーインターフェースは、非常にシンプルで使いやすいデザインになっています。

具体的には、「 SUBJECT 」「 SCENE 」「 STYLE 」の 3つのセクション に分かれており、それぞれに画像をドラッグ&ドロップするだけで、簡単に操作できるんです!

初心者の方でも、迷わず使いこなせそうですね⋯!

このインターフェースを使って、後ほど ハンズオン で詳しく使い方を解説していきますので、楽しみにしていてくださいね⋯!
早く使ってみたい! 」という方も、もう少しだけお待ちください⋯!

https://is.gd/Ma5FCE

最新画像生成AI「Whisk」のアルゴリズムとデメリット

ちなみに内部的なアルゴリズムに関してなんですけれども、このツールは、GoogleのマルチモーダルAIモデル「 Gemini 」をベースに、最新の画像生成モデル「 Imagen 3 」で画像を生成するそうです⋯!

https://da.gd/QeRj5E

「Whisk」のデメリットについて

なお、一応デメリットのところも解説をしておきますね⋯!

ただし、「Whisk」はまだ 開発段階 にあると考えられ、現状では主体を識別する機能のみで、キャラクターを一致させることはできないようです。

ここについては後で解決策をご提示します!

また、現状では 米国のIPアドレスが必要 とのことですので、その点は注意が必要ですね⋯!
つまりアメリカ国内からのアクセスじゃないと使えないということです!

ここに関しても後ほど対策方法について触れていきますね⋯!

「Whisk」と「Imagen 3」の比較

「Whisk」と「Imagen 3」についてですけれども、先ほどご紹介した 「Imagen 3」という新しい画像生成AIモデルもすごく評価されているんです。

けれども、今回のこちらの「Whisk」を使用すると、先ほども解説したように「Imagen 3」がすでに組み込まれているもので、結構いろんなスタイルを使うことができるわけなんですよね⋯!

つまりは 同じような最新の高性能モデルを使っているのに、できることの範囲が広い というわけです。

「Whisk」をおすすめする理由

ちなみに後で紹介するんですけれども、この「Whisk」本当にすごいのが、 プロンプトはシンプルなプロンプトで大丈夫ですし、日本語でも大丈夫 なので、個人的には「Imagen 3」を使用するよりもこちらを利用した方がいいんじゃないかと思っています⋯!

柔軟性も高いですし、参照画像の特徴量をAIが計算して、その特徴を生成画像に反映させる「 IP Adapter 」という技術があるんですけど、そんな感じみたいな使い方もできます⋯!

日本からアクセスできないAI技術にアクセスする方法

もちろん、 日本からアクセスできない技術 なわけなんですけれども⋯。

今回は、日本にいながらでもアクセスする方法を皆さんにお教えして、それ+α でそれでもアクセスできない人の代替手段を、他のAI技術を使ってお教えしていきます!

ここからは ハンズオン でその使い方などを見ていきましょう⋯!

メンバーシップ限定コンテンツのご案内

さて、ここからは私のNoteのメンバーシップ、もしくはYouTubeのメンバーシップ限定で、さらに深掘りした内容をお届けしたいと思います。

この記事でご紹介した「Whisk」や「Imagen 3」は、まだ日本では正式に利用できない最新技術です。

しかし、メンバーシップにご参加いただければ、日本にいながらこれらのAIを使いこなし、最先端の画像生成を体験する方法 を学ぶことができます!

さらに、メンバー限定の質問対応 や、他のAI技術を組み合わせた応用テクニック など、より実践的な内容も盛りだくさんです!

「最先端のAI技術に触れてみたい!」「他の人とは一味違う画像を作りたい!」という方は、ぜひこちらのURLからご入門して、続きをご覧ください⋯!

なお、私のメンバーシップでは、より質の高いサポートを提供するため、 参加人数を制限 しております。

少しでもご興味を持たれた方は、ぜひお早めに!
定員に達してしまう前に、ご加入されることをお勧めいたします!

入門者向け:まずはImagen 3とWhiskの、特別な違いを解説

じゃあ、そしたら入門者の皆さんは、早速続きをやっていきましょう⋯!

ここから先は

6,529字 / 28画像 / 1ファイル

🎈葉加瀬のAI研究室 ~あいラボ~ 記事/動画/質問プラン

¥2,599 / 月
あと1人募集中
このメンバーシップの詳細

この記事が参加している募集

この記事が気に入ったらチップで応援してみませんか?