【保存版】GPT-4を凌駕するGoogle最新AI「Gemini」を徹底解説。《Bard Proの日本で使う裏技とと活用事例7選付き〉

2023年12月10日 17:19

みなさん、こんにちは。チャエンです！
（自己紹介はこちら）

ChatGPTがローンチしてから1年。この1年は生成AIのチャットボット領域ではChatGPTの独壇場でしたが、ついに黒船が到来しました。

それはChatGPT-4を超える性能を持つGoogleの最新AIモデル「Gemini」です。

【⚡️速報：Googleが秘密兵器「Gemini」を公開、ほぼ全ての指標でGPT-4を凌駕】

Googleスマホ「Pixel」や「Bard」が更に進化する

もし、無料のBardに画像・ファイル解析、画像生成機能が搭載されたらChatGPTからユーザーが流れそう

Gemini API公開も楽しみに
AI開発も加速する

↓アプデ概要 pic.twitter.com/2QlQgcbpCv
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) December 6, 2023

Geminiは今年5月に開催されたGoogleの開発者向けイベント「Google I/O 2023」で、現在開発中として名前のみ発表されたプロジェクトでした。

その後、公式発表がなかったことから一部では「開発遅延説」も出ていましたが、12月7日に公開されました。

今回は、Googleの最新AI「Gemini」を紹介します。

これを読めば、Geminiの概要やこれからの生成AIの未来予想までがわかります！

0.動画説明

動画でも1-3までは解説しているので、是非見てください。

1.Geminiの概要

今回発表されたGeminiは、Googleの最大かつ最も強力なAIモデルです。これまでGoogleが提供していたBardは、LaMDA→PaLM→PaLM 2といったモデルを進化させたものでした。

Geminiは、画像、音声、動画などのマルチモーダルなデータを扱う能力も持ち合わせており、これまでのAIモデルとは一線を画す存在です。またGeminiは、安全性と責任を念頭に置いて構築されており、偏見や差別を助長するようなコンテンツを生成しないようになっています。

特に注目すべき点は、高い理解力です。

専門家を超える知識量と言語理解能力を持っています。人間の専門家が受けたMMLU試験で89.8%だったスコアを90.0%で上回り、GPT-4の86.4%をも超えています。

AI技術における大きな進歩を示しており、Geminiの能力がどれほど高いかがわかると思います。

英語ですが、分かり易いサマリーも掲載しておきます。

2.Geminiの6つの特徴

それでは今回の発表で特に注目したい６つの特徴について見ていきます。

1.マルチモーダル対応

Geminiの最大の特徴の一つは、テキスト、画像、音声、動画、コードなど、さまざまなモードに対応するマルチモーダル能力です。

最近の生成AIの大きなトレンドとなっている中、Geminiは「ゼロからマルチモーダルを前提にして学習している」ということです。そのため、リアルタイムの解析と推論が可能となり、より複雑なタスクを処理することができます。

2.3種類のモデル

Geminiは、Ultra（高性能）・Pro（最も使われる）・Nano（モバイルデバイス向け）の3種類のモデルが提供されます。さまざまなニーズに応じて最適なモデルを選択することができるようになります。

Ultra
現在はクラウドベースのスーパーコンピューターでのみ動作可能のようで、処理負荷が高いようです。また安全性検証が進行中で、実際に導入されるのは来年を予定しているとのことです。

Pro
バランスが取れており、既に部分的に導入されています。
現在は無料版のBardにテキストベースの生成AIとして、170カ国以上の地域で「英語の利用」からスタートするとのことです。その後数ヶ月以内に、マルチモーダル機能に対応する予定です。（日本でも英語で利用可能）

読解、要約、推論、プログラミングなど、多岐にわたるタスクの性能向上が期待されます。

Nano
最も軽量であるため、スマートフォン上で動作するほどの軽さを持っています。インターネット接続を必要としないバックグラウンドで動くAIモデルとして、プライバシーを保護しつつ高性能機能が提供されるとのことです。

またPixel 8 Proに限定して、Gemini Nanoを利用した先行アップデートが実施されます。最初に搭載されるのは、音声の文字起こしに「要約」機能のようです。

3.Ultraの高性能

主要ベンチマーク：GPT-4Vとの比較した評価（画像、動画、音声を含むマルチモーダル）

Googleの発表によれば、生成AIモデルを評価するために用いられる32種類のベンチマークテストのうち、30種類でこれまでの最高水準の結果を上回ったとのことです。

AI技術の新たな地平を切り開くものであり、科学、技術、ビジネスなど様々な分野でのブレイクスルーを可能にします。

4.AIチャットボットBardの進化

Proバージョンが最初に搭載された後、Ultraバージョンが追加され、「Bard Advanced」として進化します。

このアップグレードにより、Bardはより高度な推論、計画、理解が可能になり、これまでのBardの中で最大のアップデートとなります。

来年には「Bard Advanced」がリリースされ、テキスト、画像、音声に加えて、動画にも対応する予定です。

5.GeminiのAPI公開

Google AI Studioは、APIキーを使用してアプリケーションのプロトタイプを迅速に開発できる無料のWebベースのツールです。
12月13日から、Google AI StudioまたはVertex AIを通じて、Gemini Proにアクセスできるようになります。

フルマネージドAIプラットフォームが必要な場合、Vertex AIを使ってGeminiをカスタマイズ可能です。
企業のセキュリティ、安全性、プライバシー、データガバナンス、コンプライアンスに対応した追加のGoogle Cloud機能を活用することができます。

6.開発環境の整備「TPU v5p」

Google Cloudを通じて提供されるAIアクセラレータ「TPU」の最新製品です。これはAIのトレーニングに特化した「Cloud TPU v4」と比較した場合、大規模言語モデルの学習速度が2.8倍高速であるという。

3.ビジネスでどう応用されるのか

Geminiが持つ多様なモデルとリアルタイム解析や推論能力は、データ駆動型の意思決定、顧客サービスの自動化、製品開発の加速などに貢献するでしょう。
また、大量の情報から有用な知識を抽出し、新しい発見やイノベーションを促進することができます。

GoogleCEO スンダー・ピチャイはリリースの中で、Geminiを以下のように表現しています。

｢賢いソフトウェアというよりも、より便利で直感的な、相談できる専門家または仲間のように感じられるようになる｣

1.公開されたデモ機能

このデモの中で、文章だけでなく、声や画像・立体物・動画など様々な情報を並行して処理し、それらを正確に理解して論理的な回答を提供することができることがわかります。

また従来の手法では、物理のテストの答案を読み取るためにはまず手書き文字を認識し、その後その内容が正しいかを判断する必要がありました。

Geminiでは処理を分割することなく、「文字認識」と「回答の妥当性検証」を同時に行い、答案の正誤を判定することができます。
さらに、正しい回答を提示することもできるということがわかります。

Geminiは「記述式テスト」の正誤を判定し、さらに間違いの部分についても説明ができます。

Geminiのマルチモーダル能力は、複雑な問題を解決する際に、これまでのAIモデルでは到達できなかった高い理解力と柔軟性を発揮することができます。

2.Google製品への導入

Geminiは、さまざまなGoogle製品に統合されることが期待されています。
既存のGoogleツールとGeminiの主な統合ポイントです。

1.AIアシスタントBardへの導入

Gemini Proの洗練されたバージョンがBardに導入されました。Bardは推論や計画・理解をより高度に行うことができ、これはBardの発売以来最大のアップグレードとなっています。
170カ国以上の国と地域で英語版が利用可能になり、今後は多様なモダリティや言語、地域への対応も計画されています。

2.スマートフォンPixel 8 Proへの導入

Pixel 8 Proは、Gemini Nanoを搭載した最初のスマートフォンとして設計されています。新機能には「Summarize」や「Smart Reply」が含まれ、これによりユーザーはより簡潔で効率的なコミュニケーションを実現することができます。

3.Google AI StudioやGoogle Cloudへの導入

2023年12月13日から、開発者や企業はGoogle AI StudioやGoogle Cloud Vertex AIを通じてGemini Proにアクセスすることが可能になります。
Google AI Studioは、APIキーを使って迅速にアプリをプロトタイプ化できる無料のウェブベース開発ツールです。

Vertex AIはフルデータコントロールでGeminiをカスタマイズできる完全管理型AIプラットフォームであり、企業のセキュリティやプライバシー要件に対応するためのGoogle Cloudの追加機能を利用できます。

4.Android 14への導入

Android開発者は、新しく追加されるAndroid 14のシステム機能AICoreを介してGemini Nanoを利用できるようになります。この導入はPixel 8 Proデバイスから開始される予定です。

これらの統合により、GeminiはGoogleのさまざまな製品やサービスに広がり、多方面でユーザーに利益をもたらすことになるでしょう。

4.Bardの活用事例7選

Bardを使うことでできることを7つ紹介します。ChatGPTでできないことなどもあるので、ぜひ覚えてください💡

Bard自体は無料で使えます。
また、Gemini Proが搭載された最新のBardを日本で利用する裏技もご紹介します🔥

ここから先は

1,536字 / 8画像

¥ 600

ログイン

この記事が気に入ったらチップで応援してみませんか？