見出し画像

【バイバイChatGPT👋】Google Gemini で動画要約、長文処理、検索…OK⁉️無料でここまで使える🔥葉加瀬式・Gemini活用術🚀情報収集が爆速に👀

どうも皆さん!リモコン探してたら実は手に持ってた、そんな経験ありませんか? 葉加瀬あい(ハカセアイ) です!

実は私、今までGoogleのAI、Geminiを使って 約400万文字の記事・動画を作ってきたんですけども、今回は、Google Geminiの魅力と、その活用方法について徹底解説します!  

Google Geminiって、なんだか難しそう…使いこなせるか不安…。そう思っていませんか?  

長い動画の内容を理解させたり、複雑な質問に答えさせたりするのは、ハードルが高いと感じるかもしれません。「もっと簡単に、Geminiの機能を使いこなしたい!」と思いませんか?  

実は、Google Geminiには、無料でも使える機能がたくさんあり、ちょっとしたコツを知るだけで、皆さんの情報収集や作業効率を劇的に向上させることができるんです!

ということで今回お話しする内容はこんな感じです!

  • ① 動画の内容理解、長文処理、ベンチマークテストでの優秀な成績…Google Geminiの驚くべき実力と、無料でのチャット利用方法を大公開!

  • ② Google AI Studioで画像・動画を扱う方法や、AIの返答をカスタマイズする裏技を伝授!

  • ③ Gemini AdvancedのDeep Research機能や、Google Search機能を活用して、調べ物時間を大幅に短縮!さらに、AI ReaderやPerplexityと組み合わせた、最強の情報収集術も紹介!

それで、私の メンバーシップ に入門されている方は、いつものように記事内容を 動画 で見ることができます!

動画版は、こちらのURLからご覧ください!

(Comming Soon)

それから、Noteのメンバーシップ の入門者さんには 質問対応 なども行っていますので、感想や質問などありましたら、できれば Xのリプライ で教えてください!

XのDM や Noteのコメント でも構いません🙆‍♀️

※ 質疑応答の際は 『NoteのID + 質問したいNote記事のURL』 を添えてください。

https://x.com/ai_hakase_

それでは、本日もよろしくお願いします!


チャットAI、つまりLLMを使うならGoogle Geminiが最強!?その理由を徹底解説します!

ということで、今回は、チャットAI、つまりLLMを使用するなら、Google Geminiが実は最強なんじゃないか、というお話をさせていただきます!

Google Geminiのココがすごい!魅力ポイントをチェック!

まず、Google Geminiのすごいところを、ざっくりとご紹介します!

  • 動画の内容を理解できる!

  • 長い文章(ロングコンテキスト)も処理できる!

  • ベンチマークテストで優秀な成績!

  • 「Google AI Studio」で画像や動画も扱える!

  • 画像も生成できる!

  • ほとんどの機能が無料で使える!

すごいですよね...!

ちなみに、今までGoogleのGeminiについては、いろんなところで解説してきたんですけど、実は「Google AI Studio」っていうのを使えば、なんと無料で使えちゃうんです😆✨

https://note.com/ai_hakase/n/n381d3dac7a26?magazine_key=m52cf05689792&from=membership-magazine

なので今回は、その辺のことについても それぞれ詳しく解説していきます!

https://note.com/ai_hakase/n/n05c7e13d1565?magazine_key=m52cf05689792&from=membership-magazine

よかったらここら辺の記事も見てみてください!

https://note.com/ai_hakase/n/n19a17371bfa9?magazine_key=m52cf05689792&from=membership-magazine

Google AI Studioとは?無料で使える高性能AI!

ということで先ほども記載した通り、普通にチャットするだけなら、 無料 で使えちゃうので、これからご紹介する画像とか動画も理解できちゃう「Google AI Studio」っていうのも、ぜひ使ってみてほしいです!

参考: https://accounts.google.com/v3/signin/identifier?continue=https%3A%2F%2Faistudio.google.com%2Fprompts%2Fnew_chat&followup=https%3A%2F%2Faistudio.google.com%2Fprompts%2Fnew_chat&ifkv=ASSHykr0LcuNmOb_VlKvmadhBvqke3CuHoLIsMsfP9zz7x8V_fkylGY8kJhZx8twejia9Ojr8okmqQ&passive=1209600&flowName=WebLiteSignIn&flowEntry=ServiceLogin&dsh=S-2110597349%3A1740376423506729

システムプロンプトでAIをカスタマイズ!

Google AI Studioを詳しく説明しますと、モデルの所から選ぶこともできますし、こちらの システムプロンプト を書き加えることも可能です。これを使うと、AIの返答をこちらが指定したようにカスタマイズできるんですよね。

例えば「語尾にダニャンをつけて」と指示すると、返答の語尾に「ダニャン」という言葉をつけて、猫みたいな感じで返信してくれたり⋯といったことも可能です。  

システムプロンプトの活用例:外国語対応

このシステムプロンプトについてなんですけども、かなり便利で、私、結構よく、海外のクライアントとお話しするときに使用しているんです。

こんな感じで、日本語を英語に変換したいものを送ってあげて、英語のレスポンスと日本語訳を一緒に返答してもらう、といったような使い方もできます。

画像や動画の内容だって理解しちゃうし、長い文章( ロングコンテキスト っていうんだそうです!)もへっちゃらなんです!  

動画の内容を要約!文字起こし&箇条書き

それと、こんな感じです!動画をアップロードしてあげて、「文字起こししてから要点を箇条書きでまとめてください」という風に指示すると、こんな感じで文字起こししてから、要点をまとめてくれたりもします。

結構、ここら辺の動画理解ができるAIモデルって少ないので、すごく嬉しいですよね。

ちなみに、結構私やっているんですけども、研修動画を、Windowsの場合だと「Windowsマーク + Shift + R」のショットカットで画面録画できるんですけど、画面録画で撮って、それを音声で録画して、その研修動画をドキュメント形式に変換してもらってから、そのドキュメントと参考動画を作成する、なんていうことも結構やってます。  

動画のトークン数と処理可能時間

それで、結構今上げたこちらの動画を見ていただくとわかるんですけども、だいたい1分くらいの動画でトークン数が15000くらいかかる計算になるので、先ほど挙げた200万トークンの大容量コンテキストウィンドウということを考えると、最大で 約133分 の動画を処理することができます。

つまり、数時間の動画とかをアップロードして質問したりとかしても、対応してくれるといった感じになります!

もちろん画像もできます。

一応、Google AI Studioの中でも私が激推ししているモデルが今この2つになるんですけども、2つとも動画も理解できるし、すごい画像も理解できるんです。

違いを申し上げますと、 Gemini 2.0 Pro Experimental は、200万トークンという、すごい巨大なコンテキストウィンドウを備えてまして、一般的な推論、つまりは「〇〇について教えてください」って言ったことに対する答えとかがすごく高性能で、そのコンテキストウィンドウの大きさによって、本来はすごい大きなトークン量を必要とする動画とか画像とか、そういうビジュアルの理解とかも本当に凄まじいんですよね。

しかも、コーディングとか文章の生成とかもすごい得意なので、本当に至れり尽くせりなんです!

Gemini 2.0 Flash Thinking Experimental 01-21 というのは、ChatGPT-O1 や GPT-O3 mini のように、段階的にAIが考えてから返答をくれる、というシンキング機能もあるんです。

推論能力の高さは?コーディングも可能!

ちなみに、本当に推論能力が高いので、こんな感じで、磁石の動きをシミュレートするプログラムが作れるそうです!

しかも…!😲 コーディングの知識や経験は一切不要とのこと!✨

最初の試作では衝突判定などに問題があったそうですが、約30分のトラブルシューティングで修正されたそうです!👏

床、天井、壁を作成することで、灰色のオブジェクトが消えないように工夫されています!

参考: https://x.com/caleb_friesen2/status/1887554634257965222  

ベンチマークテストでも優秀な成績!

ベンチマーク っていう、AIの性能テストでも、かなり優秀な成績を叩き出してるんだとか!🏆

ここら辺見ていただくとわかるんですけども、Gemini 2.0 ProとFlashはすごい高成績ですよね。

さすがに、ChatGPT-O1 や GPT-O3 mini、DeepSeeker-R1 とか、よく考えてから回答を出すAIモデル、つまり Thinking LLMには少し僅差で負けているんですけども、それでもコストパフォーマンスとか、あとは動画とか画像の理解ができたり、200万トークンものロングコンテキストを備えていることを考慮すれば、そんなに多機能でこんな性能やベンチマークテストの結果を備えているのは、本当にすごいかと思います。

というか余談なんですけど、Gemini 2.0 Flashって、この表で見ると第5位なんですけど、あんなにほぼ無料みたいな価格で、これだけの性能を誇るのって、本当にすごいですよね⋯!

参考: https://x.com/ArtificialAnlys/status/1887505398464380948/photo/1

Gemini AdvancedのDeep Research機能と、情報収集の裏技について

さて、次はさらに一歩踏み込んで、Gemini Advancedの機能に焦点を当ててみましょう。特に、情報収集を強力にサポートする「Deep Research」機能と、その活用方法について詳しく解説していきます。

Gemini Advanced(月額約20ドル/約2,900円、初回1ヶ月無料トライアルあり)には、「Deep Research」という、詳細な調査を可能にする機能が搭載されています…!🔍  

Deep Researchとは?

調べたいトピックを入力するだけで、あらゆるトピックについて包括的でわかりやすいレポートを迅速に作成してくれる、強力なツールです…!😳

Deep Researchで出来ること

  • 複雑なテーマも、深く掘り下げて調査できます!🧐

  • わかりやすいレポート形式でまとめてくれます。

  • 研究や学習、情報収集の効率が大幅に向上します!🚀  

Gemini Advancedに加入すると、Googleドライブの容量も100GBまで増えます。Google ColabなどでAIを頻繁に利用する方には、とても嬉しい特典ですね!🎁

現在話題のNotebook LM Plusも使えるので、本当に得しかないです😭

Gemini-Search

「ちょっとした調べ物だけしたい」という場合もあるかと思います。

Vertex AI(Google Cloudから利用可能)のGoogle Searchという機能を使うと、Google検索で調べた内容を元にレスポンスを返してくれます。(ただし、これはちょっと利用するまでにハードルがあるかもしれません💧)

通常のDeep Searchよりも時間がかからないため、簡単な調べ物に適しています。

例えば、Vertex AIのGoogle Searchで「Gemini 2.0 Flash Thinking Experimental 01-21のことについて最新情報を以下のGoogleサーチを使ってまとめてみてください 」と質問してみました。

その結果、ウェブ上の情報をしっかりと調べて回答してくれました。

通常のGeminiのモデルでは2024年5月までの情報しか学習していませんが、Vertex AIのGoogle Search機能を使うことで、 最新の情報を反映した回答 を得ることができます!  

簡単な調べ物の裏技

「Deep Searchは少し時間がかかる…😥」「Google SearchはVertex AIの機能なので、Google Cloudのアカウントが必要だ…」と感じる方もいらっしゃるかもしれません。

そこで、さらに手軽に情報収集できる裏技をご紹介します。実は、URLの最初に、

https://r.jina.ai/と付けるだけで、ウェブサイトの内容を文字起こしできるんです!✨

これは、Jina AI Readerというツールを利用した方法です。Jina AI Readerのホームページはこちらです。

https://jina.ai/reader/

Jina AI Readerは、ウェブサイトの情報をLLMで処理しやすいテキストに変換してくれます。
それでは、実際に、Jina AI Readerのホームページで試してみましょう。  

まず、URLの最初に「`https://r.jina.ai/`」を追加します。すると、文字起こしが表示されますので、Ctrl+Aなどで選択し、コピーします。

そして、Geminiに「この内容の要点をまとめてください」と指示を出し、コピーしたテキストをペーストして生成します。  

ディープリサーチと併用でさらに効果的に!

生成ボタンを押すと、GeminiがURLの内容を読み取って、要点をまとめてくれるんです!

Geminiは長い文章も得意なので、文字起こしされた情報も問題なく処理し、きれいなまとめを作成できます!👍

私、実はこういう機能を使ってドキュメントを作成することが多いんです。

この方法だと、ディープサーチ特有のハルシネーション、つまりAIが勝手に想像して作ってしまった回答をかなり減らせるので、 非常に便利 だと思います。

ちなみに余談ですが、この技術はディープリサーチなど、ネット上のソースを参考にレポートを作成するAIのバックグラウンドで、かなり使われています。

基本的なリサーチは「https://r.jina.ai/」でサクッと済ませて、もっと詳しく知りたいときにディープサーチを使う、というのが おすすめの使い方 です!  

もしソースの取得などが面倒でしたら、Perplexityのような無料リサーチツールで調べ物をしてから、そのURLを個別に Jina AI Reader や Gemini で処理するといったやり方もおすすめです。この方法ですと、最新の情報にもアクセスしやすいです。

参考: https://www.perplexity.ai/

Jina AIの便利なツールもご紹介

さらに余談ですが、Jina AIは、以下のようなディープサーチも無料ツールとしてリリースしていますので、よろしければご覧ください。

Jina DeepSearch は、質問を入力すると、思考過程を含んだ回答を返してくれるAI検索ツールだそうです!👀

ただし、一度に一つの質問にしか答えられず、追跡質問はサポートされていないそうです…!

また、オープンソースで皆さんのPCにインストールして使うこともできます。Gemini、OpenAI、またはローカルLLMをサポートしているとのことです。  

動画内では、色々と調べてくれたり、クエリの生成などをしてくれて、2.0フラッシュシンキングの説明などをきちんと行い、リファレンスURLなども出してくれる様子が紹介されています。  

🎈おわりに

いかがだったでしょうか!今回は、Google AI StudioとGeminiの様々な活用法を総まとめ、といった内容でした!

1. Google AI Studioは無料で高性能なAIを簡単に利用でき、システムプロンプトで応答をカスタマイズ可能。
2. Gemini 2.0 Pro ExperimentalとGemini 2.0 Flash Thinking Experimental 01-21は特におすすめで、高度な推論能力やコーディング能力を持つ。
3. Jina AI ReaderやDeep Search、Perplexityなどのツールを組み合わせることで、Geminiをさらに有効活用し、情報収集や分析を効率化できる。

ぜひ、これらのツールやテクニックを試して、AI活用の幅を広げてみてください!それでは、また次回のブログ記事でお会いしましょう!!

今回の記事・動画、楽しんでいただけましたか?

もし「面白かった!」「参考になった!」と思っていただけたら、ぜひ NoteのフォローYoutubeのチャンネル登録 をお願いします!

高評価コメント もいただけると、とっても嬉しいです。今後の活動の励みになります!  

Youtubeでは期間限定で一部の動画を公開していますが、メンバーシップにご登録いただくと、全ての動画アーカイブがご覧いただけます!

記事に関する ご質問転載のルールご利用にあたっての注意点 などは、こちらにまとめていますので、ご確認ください!  

それでは、また次の記事か動画でお会いしましょう!

葉加瀬あいでした!バイバーイ!

☑️ 関連リンク一覧
(※ AI生成です。リンクは正しいですが、タイトルは間違っていることがあります。)

X でも、最新のAI技術情報を発信しています✨ よかったらフォローしてね🧸


いいなと思ったら応援しよう!

この記事が参加している募集