Gemini について全部解説! 使い方やモデル、プランまで
こんにちは、Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。
この記事ではGoogle の AI、Gemini に対するみなさんの疑問に答えていきます。
"Gemini" という名称で AI モデルやサービスが複数あるけど、違いは何? 有料版 / 無料版はどう選べばよい?アプリはあるの? などなど。
誰でもすぐに使える会話インターフェースの Gemini(gemini.google.com)の紹介を中心に、企業や開発者向けサービスの展開、すべての基盤となる Gemini モデルの話まで全体像を解説します。
Google の AI「Gemini」をもっと知って、みなさんの役に立てていただけるようまとめました。
この記事は随時アップデートして最新の情報をお届けします。(最終更新 2024 年 10 月 31 日)。
今回のアップデート(2024 年 10 月 31 日更新内容)
Gemini Advanced で特定のタスクに特化した Gemini を作成できる「カスタム Gem 機能」や、最新の画像生成モデル「Imagen 3」による画像生成機能の日本語対応、Gemini とより自然に会話ができる「Gemini Live」の日本語提供開始などの内容を追記しました。
Google の AI、Gemini(ジェミニ)って何?
Google の AI「Gemini(ジェミニ)」は、Google が開発・提供している生成 AI です。膨大なデータを学習することで、ユーザからの入力をもとに、新たなコンテンツを生み出せる生成 AI は、ここ数年で世の中に浸透しました。2024 年も大きな注目を集め、ビジネス、趣味など幅広く活用されるようになっています。
また、テキストや画像、音声など複数の形式のデータ(モダリティ)を入力したり、出力したりすることで、より多彩なタスクを処理できる生成 AI をマルチモーダル AI と呼びます。
Gemini もマルチモーダル AI のひとつで、例えばクッキーの写真とともに「このクッキーのレシピを教えてください」と入力して、レシピを出力させることも可能です。
会話インターフェースの Gemini はアクセスも簡単!
Gemini のアクセス方法
ウェブ版(gemini.google.com)
Android スマホの Gemini アプリ、Google アシスタントから切り替え
iOS の Google アプリからアクセス
ぜひ、身近な方法で Gemini に話しかけてみてください。
Gemini の特徴
長い文章の要約・分析、メール・挨拶のドラフト、アイデア出し・壁打ち相手、情報収集・プランニング、プログラミング・学習・就活のサポート… 。
Google アカウントを持っていれば、誰でも、以下の特徴をもつ Gemini と一緒にさまざまな作業ができます。
Google 検索との連携で、最新トレンドの理解、「回答を再確認」から、出力された回答を裏付ける情報がウェブ上に存在するかどうかをダブルチェックできる
画像で指示を出したり、画像付きの直感的な回答がもらえる
3 つの回答案が用意され、文章のスタイルも調整可能
Gmail、Google Sheets などのサービスに Gemini の出力結果をエクスポートできる
Google マップや YouTube など各種 Google サービスと連携
例えば、外国のニュース記事を短時間で理解できるよう翻訳してもらったり、新商品のキャッチコピーを考えてもらったり、旅行プランを組んでくれたり、Gemini はみなさんの創造力を引き出し、生産性を高めるサポートができます。
Gemini の無料プラン / 有料プラン / ビジネス・企業向けプラン
コンシューマ向け Gemini には、誰でも簡単に利用可能な無料版「Gemini」と、より高性能で多くの機能を利用できる有料版「Gemini Advanced」が用意されています。
より複雑なタスクをお願いしたい場合や、大きなデータを扱いたい場合、最上位の Gemini モデルを使いたい場合は、有料版 Gemini Advanced がおすすめです。こちらは「Google One AI プレミアム」プランに加入することで利用できます。
Gemini Advanced では Gemini の最新機能をいち早く利用できるほか、以下の機能を使うことができます。
1. Google 最上位モデル搭載 & 業界最長の 100 万トークン
約 1,500 ページの書類、100 件のメール相当の処理が可能
2. テキスト・画像・動画含むマルチモーダルなデータ処理
無料版で扱える画像・テキストに加え、コードの編集・実行が可能
3. 複数のファイルからのデータ分析・グラフ作成
複数の PDF や書類、スプレッドシートからの分析やグラフ作成が可能
4. カスタム Gem による Gemini のカスタマイズ
特定の目的・タスクに特化した Gemini の作成が可能
5. Google AI プレミアムプランの特典(今後展開予定)
2TB のストレージに加えて、Gmail や Google ドキュメントなどのサービス内のGemini サイドパネルから Gemini が利用可能
また、Gemini Advanced よりは一部機能が制限されていますが、セキュリティやプライバシーの保護をより強化したい方は、ビジネス・企業向けの Gemin for Workspace がおすすめです。
Gemini for Google Workspace を利用するには、Google Workspace ライセンスに加え、 Gemini を利用できる追加ライセンスが必要となりますが、データがモデルの学習トレーニングに使用されることなく、ファイル権限は Googleドライブと連動するなどエンタープライズ グレードのセキュリティを実現していることが特徴です。
無料プラン / 有料プラン / 企業版の提供機能をまとめると以下のとおりです。
ぜひ皆さんの用途に合わせて、適切なプランをお選びください。
基盤となる 4 つの Gemini モデルと開発ストーリー
さまざまな用途に使えてとても便利な Gemini を支えているのは、 Google が開発した共通基盤である「Gemini モデル」です。
しかし、ひとつの Gemini モデルであらゆるニーズを満たせるわけではありません。たとえば、時間がかかってでも複雑なタスクを正確に実行したい場合や、短時間に素早く応答することが重要な場合、ネット接続がない環境で使われる場合など、状況によって AI に求められる性能は異なります。そのため、あらゆる状況に対応するために、4 つの Gemini モデルを用意しています。
Gemini 1.0 Ultra:Gemini シリーズで最もサイズが大きく、複雑なタスクを解くことに適したモデル
Gemini 1.0 / 1.5 Pro:幅広いタスクに対応でき、一般的なパフォーマンスに最適なモデル
Gemini 1.5 Flash:軽量、高速、コスト効率に優れた最新モデル
Gemini Nano:データ ネットワークの有無にかかわらず、デバイス上で迅速な応答を提供するように最適化されたモデル
中でも、Gemini 1.5 Pro は、一度の会話で最大 200 万トークンもの情報を扱えます。200 万トークンは、約 3,000 ページの書類、または約 200 件のメールの情報量に相当します。ひとつ前の世代の Gemini モデルや、他の AI モデルが一度に処理できるトークン数は数万から数十万でした。それが何倍にもなることで、よりたくさんの情報を知って、より長い文脈を踏まえたうえで、回答を生成できるようになっています!
注: 2024 年 10 月末現在、開発者向けには 200 万トークンまで拡張していますが、コンシューマ向けの Gemini 有料版 Gemini Advanced では最大 100万 トークンです。
出典:https://deepmind.google/technologies/gemini/
そして、これら Gemini モデルの研究開発プロジェクトを率いる組織が、Google DeepMind です。
過去 10 年にわたって別々に AI 研究を続けてきた、DeepMind と Google Brain という 2 つのチームが 2023 年 4 月に合併して誕生しました。2 チームが(双子のように)ともに開発にあたっています。ラテン語で双子を意味する "Gemini" という名前には、こんな開発ストーリーも込められています。
Gemini エコシステム
Gemini モデルの基盤の上にはさまざまなサービスが展開されており、大きな「Gemini エコシステム」を形成しています。
単独のチャットボット・サービスとしては、ここまでお伝えしてきた無料版 Gemini および Gemini Advanced のほか、パーソナライズされた AI リサーチ アシスタントとして様々な形式の文書の解析・要約などができる「NotebookLM」が提供されています。
また Gmail、Google ドライブなどの Google Workspace 製品をはじめ(Gemini for Google Workspace のGemini Business / Enterprise プラン)、 Android 端末や Google Pixel スマートフォン、Chromebook などの Google 製品にもGemini が組み込まれ、AIによるアシスタント機能が利用できるようになっています。
さらに開発者向けにも、200 万トークンのコンテキストウィンドウが利用できる「Google AI Studio」や、Google Cloud のフルマネージド統合 AI 開発プラットフォームの「Vertex AI」が提供されています。
このように、Gemini は多くの方のニーズに合わせたサービスを複数提供しています。
Gemini アップデート情報まとめ
本記事が 2024 年 6 月 19 日に公開されて以降も、Gemini ではさまざまなアップデートがありました。主な内容は以下のとおりです。
Android 端末の Google メッセージアプリ内で Gemini が利用可能に(詳細)
安全対策を講じた上で、10代のユーザーにもアクセスを拡大(詳細)
Gemini Advanced で特定のタスクに特化した Gemini を作成できるカスタム Gem 機能が追加(詳細)
最新の画像生成モデル Imagen 3 による画像生成機能が日本語に対応し、無料版および Gemini Advanced に登場(詳細)
Gemini とより自然に会話ができる Gemini Live が、無料版および Gemini Advanced のAndroid Gemini モバイルアプリで利用可能に(詳細)
このようなアップデートを通じて、Gemini はより多くの方の私生活や学業、ビジネスなどを支援できる AI を目指しています。
Gemini の進化をお楽しみに!
Google は 2023 年 5 月に開催した「Google I/O 2023」で、「AI をすべての人にとって役立つものにする(Making AI helpful for everyone)」というミッションを掲げ、Bard の日本語対応をいち早く実現しました。
それから 1 年後、Bard は Gemini に生まれ変わり、グッと進化しました。lmsys.org による評価では、2024 年 8 月 18 日時点の Gemini 1.5 Pro が総合及び日本語共にでトップになりました。また同年 10 月 31 日時点においても、引き続き日本語で同率 1 位となっています。
でも、ここで立ち止まらずに、さらなる使いやすさのためにロング インプット & アウトプットに最適なアップデートを続けていきます。そして何よりも、みなさんの利用が Gemini モデルの改善につながっていきます。
なお、Gemini を使っていただいて「ここがよかった」「この使い方がうまくいかなかった」「もっとこうしてほしい!」があれば、聞かせていただきたいと思っています。
ぜひ最新の Gemini をビジネスに、趣味に、幅広く活用して、プロダクト上の 👍👎でフィードバックをお願いします!