
けんすうさんが考える、「生成 AI と上手に付き合うために知っておきたい5つの強み」
こんにちは。Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。
今回は、Gemini アドバイザーのおひとり、古川健介さん(以下、けんすうさん)から、「生成 AI との正しい付き合い方」に向けて理解すべき「生成 AI ならではの 5 つの強み」について、アドバイスをいただきました。
以下、けんすうさんからのメッセージです。
生成 AI ブームもどんどんと広がっていって、一過性のブームはなく、細かい個人の生活から、大規模な業務への利用まで、浸透がどんどんと進んで行っている感覚があります。
しかし、中にはまだ「生成 AI を日常的に使っているというわけではなく、たまに触る程度」みたいな人もいますし「いろいろな AI チャットを触ってみたが、いまいち活用できている気がしない」という人も多いと思います。
これは、まだ生成 AI というものがどういうものなのか?というのがわかっていないからではないか?と思っています。
そこで、「そもそも生成 AI はここが強いから、ここを押さえておくといいよ」というのを簡単にまとめたので、まだ使いこなせていないなーという人は是非とも参考にしてみてください!
*本 note は、Google がけんすうさんにご依頼して執筆いただいた原稿を再編集して掲載しています。けんすうさんには、Gemini の改善や活用のための知見をいただくため、アドバイザーに就任いただいています。また、Gemini を含む生成 AI の利用に関する説明は例示を目的としています。実際の回答結果については、ご自身で正確性・適切性をご確認いただき、利用規約に従った利用をお願いいたします。
生成 AI とは?
生成 AI とは何か?というのを一応、教科書的に説明しておきます。
一番シンプルに説明してしまうと、
「たくさんの例を見て学習してパターンを理解することで、新しいコンテンツ(文章、画像、動画など)を作り出すことができる」
くらいになります。
正確性をあげようとすると、いくらでも正しく説明できると思うんですが、いったんは
たくさんの例を見て
「こういうパターンだな」と理解した上で
新しいコンテンツを作れる
のが「生成 AI」だ、と考えてください。
笑い話ですが、昔の生成 AI に「こういう感じの Google スライドの資料をつくって」とお願いしたら
「わかりました、作りますね!できあがったらお伝えします」
と返信がかえってきたので、
「何分くらいでできますか?」
と再度返信をしたら
「30 分もあれば、一度作ったものをお見せできます」
と言われたんですね。
なので、素直に待っていたら、全然資料なんて作っていなかった、というケースを見たことがあります。
これは生成 AI が何をしているかというと、「こういうことを言われたら、人間はだいたいこういう感じで返信しているな」というパターンだけをみて「それっぽい会話を生成しているだけ」みたいな感じなんですね。
「資料を作ってとお願いされたときの、人間の会話コンテンツを生成した」ということです。
なので、「たくさんの例を見て学習してパターンを理解することで、新しいコンテンツ(文章、画像、動画など)を作り出すことができる」という感じなんだな、と理解した上で使うのが重要です。
この仕組みを理解した上で・・・。生成 AI の強みを頭にいれておくとさらにわかるので、それを今から 5 つ、ご説明します。だいたいこの 5 つを理解しておくと、初心者でもいい具合に生成 AI を使えるようになります。
①超大規模・高速な生成能力を持っている
生成 AI は大規模で、高速に生成できるというのが強みです。
生成 AI だと、膨大な量のコンテンツを短時間で生成できるんです。たとえば「キャッチコピーを生成 AI で 1,000 個作ろう」なども余裕でできてしまいます。
さらにいうと、これを 24 時間 365 日、疲労なく創造的作業を継続することもできます。理論的には、1 日かけて、数万件のキャッチコピーを作ることもできるわけですね。人間だと絶対に無理です。
逆にいうと「1 つのことを一発で一番いいものを出そう」とかするのはもったいないわけです。
むしろ、「大量に生成して、人間が選ぶ」みたいに、お互いに強みを補完し合う方がいい。
たとえば「キャッチコピーを作ってくれ」と言って 1 つだけ出してもらうとかは、あまり生成 AI の能力を活かしていません。

こんな感じになってしまいます。ちょっといまいちですよね。
でも「ブレインストーミングのために、30 パターンを出して」というとそこから「あ、こういうアイディアもあったか」という気づきを得られたりします。

それを選んで「この方向性で 100 パターン考えて」とかもできるわけです。
②超広範囲の知識
生成 AI は超広範囲の知識を持っています。
よくあるのが「これについて生成 AI に聞いたけど間違ってたよ」みたいな反応なんですが、これはたしかに起こりえます。これは、生成AIが進化の途上にある新しいテクノロジーであるが故に起こるものです。
しかし、人間では到底無理な範囲の知識を持っているというのもあります。あまり知らなそうと思うのは、だいたいの人間が、自分の得意分野の詳しいコトを聞こうとしてしまうからです。
しかし、生成 AI は多言語、多文化の情報も持っているのが強いんですね。
たとえば、「太宰治の人間失格」も知っていれば、イワン・ツルゲーネフの「Первая Любовь(はつ恋)」も知っているので、「2 つの小説の要素を一部取り入れた新しい小説の設定を考えてくれ」とかもできるわけです。

この 2 つの小説を理解して組み合わせる、というのをすぐにできる人はそこまで多くないと思うのですが、AI だとこういうことが即座にできます。
さらに、異分野の知識も組み合わせることもできます。宇宙工学の知識も組み合わせて新しい作品を作る、とかですね。
なので、「広範囲の知識を持っている」というのをいかに活用するのか?という観点を持っていると使いやすくなります。
③人間だと考えづらい予想外の発想ができる
人間だと「これは無理だな」みたいなのが結構バイアスになって発想がでてこないことがあると思います。もちろん、AI にバイアスがないというつもりはありませんが、少なくとも人間より発想を広げるのが得意な場合もあると思っています。
たとえば②で、「太宰治の人間失格」と「Первая Любовь(はつ恋)」をあわせた小説の設定を作って、それを題材にしたオリジナルソングの歌詞の素案を作る、みたいなことをしても、なんとかやれちゃったりするわけです。

人間だと「いやいや、それは無理ですわ」となってしまったり、頭を抱えてしまうようなことでも、とりあえず考えて生成してくれます。
となると、無茶な題材を組み合わせて、コンテンツを大量につくって、それを人間がみて、別の発想をする、とかの使い方をすると、うまくワークします。
④マルチモーダルで柔軟な創造
マルチモーダルとは、要は「テキストとか、画像とか動画とか、音声とか、いろいろな形式を扱える」みたいな感じです。
たとえば、小説を作ろうとしてたけど「やっぱりこれ、歌がいいな」となった場合、人間だと別の人間がやらざるを得なかったりします。
なぜなら小説もかけて、歌も作れるという人は少数だからです。
生成 AI だと、いろいろな形式でもすぐにできるので、いろいろな表現を試せるというのもあります。
ちなみに Gemini では画像生成ができるので、たとえば先ほど考えた小説を視覚化する場合のアイディアを出して、といったこともすぐにできちゃいます。

⑤再現性と無限のカスタマイズ
そして、それらには再現性を持たせることもできます。
たとえば「1 つの画像を作ったら、ある程度の再現性を保ちながら、いろいろなものを作る」とかもできます。
Gemini ではプロンプトに画像を添付できるので、「以前作成したこの画像を参考にして作って」とかもできるわけです。
このポイントを抑えると・・・
生成 AI ならではの強みをだいたいこんな感じで頭にいれておくと、「複雑なプロンプトをいろいろ覚えて、使いこなさないといけない」というのがいかに間違いか分かると思います。
プロンプトを知る前に、生成 AI の強みをちゃんと把握した上で、その強みをいかに使ってあげつつ、人間の強みと掛け合わせるのか?を考えるとうまくいきやすいのでオススメです。
参考にしてみてください・・・。では!
以上、けんすうさんからの生成 AI 活用に向けたアドバイスでした。
パソコンやスマートフォン、タブレットなど、さまざまなデバイスからご利用いただける Google の生成 AI、 Gemini(gemini.google.com)。今回のお話をきっかけに、ぜひ使い込んでみてくださいね!
note ではこれからも、さまざまな人に活用法を聞いたり、使い方のコツを紹介したりしていきますので、楽しみにしていただけるとうれしいです。
※ 文中でご紹介した Gemini による大量のアイデア出しに関して、製品の仕様によっては機能上、難しい場合があります。また、1,000 個など数が多い場合は、複数回に分けてプロンプトを実行する必要があります。