見出し画像

Googleの新AI Gemini 2.0の詳細が流出した!

4,090 文字

ほな、The Vergeが新しい記事を出してきましてな。Googleの次世代フロンティアモデルに関する情報漏洩について語っとるんです。この内容がめっちゃ興味深いんですわ。というのも、次のモデルサイクルで予想外のことが語られとって、状況が変わりそうなんですけど、ほとんどの人が考えてるんとはちょっと違う方向やと思います。
ここに書かれとるように、Googleは次のGeminiモデルを近々発表する予定やそうです。これは前回のモデルリリースからの時間を考えたら予想できたことですわな。12月は OpenAIとGoogleから重要な発表が相次ぐ月になりそうです。もちろん、Anthropicがコンピュータを制御しようとしてることやSatya Nadellaの好調な年についても触れられとるんですけど、今回の動画の主な焦点はGoogleになります。
ご存知の通り、去年の今頃にGemini 1.0 Proをリリースしましたわな。これが素晴らしかって、GPT-4を追い抜いたんです。まぁ、いろんな面で信じられへんくらい凄かったんですけど、今また皆の目がGoogleに注がれとるわけです。次のフロンティアモデルで何を見せてくれるんかとね。
いろんな憶測が飛び交っとるんですけど、私も調べてみて、いくつか面白いことが分かってきました。ほな、12月にGoogleから出てくる可能性のあるものと、次世代フロンティアモデルについて詳しく見ていきましょか。
記事によると、同僚のKylie RobinsonとTom Warrenが報告したように、OpenAIは12月に次期フラッグシップモデルのデビューを狙っとるそうです。それに合わせて、Googleも同じ月に次期主力モデルのGemini 2.0をリリースする計画やと情報筋が語っとるんです。
これはもう、GoogleとOpenAIが互いに競い合い続けるトレンドの延長線上にあるわけですな。覚えておられると思いますけど、去年の今頃、GoogleがGemini Proをリリースして、当時のOpenAIのGPT-4を様々なベンチマークでぶっちぎりで上回ったんです。多くの人にとって驚きやったんですけど、コーディングや異なるコンテキスト、長文処理において高度な推論能力を示したんですわ。
そういう状況の中で、OpenAIとGoogleだけやなく、AnthropicやX、それにMetaも次世代フロンティアモデルのデビューを急いでるんです。これがまた面白い展開で、というのも最近もOpenAIやGoogleからフロンティア企業の頻繁なアップデートがあったわけです。Metaのllama 3.2とかOpenAI 1、それに大半の人が気付かんかったGoogleの秘密モデルとかもありましたしね。
ただ、この記事の中に驚くような部分があるんで、それをお見せしたいと思います。ただし、これは純粋な憶測の域を出ません。記事の情報が完全に間違っとる可能性もあるんです。時々そういうこともありますからね。この内容を報じとるのはこの記事だけなんですけど。
残念ながら、次世代モデルはチームが期待してるほどのパフォーマンス向上を示してへんらしいんです。記事によると、OpenAIのCEOのSam Altmanは、GPT-4の成功をビジネスパートナーから段階的に展開しとるようです。一方、Googleは次期バージョンのGeminiを最初から広く公開する予定やそうです。つまり、事前アクセスや特別なアカウントは無しで、一斉リリースということですな。新モデルに誰もが同時にアクセスできるようになるわけです。
もしこれらのモデルが多くの人が予想してた推論能力を提供できへんとしたら、AI業界にとって非常に興味深い転換点になるかもしれません。これは様子見が必要やと思います。というのも、モデルに関する事前の憶測というのは、時には的確で、時には完全に外れることもあるからです。
もしモデルが期待ほど良くないとしたら、また次のパラダイムに移行する可能性があると思います。つまり、テストタイム・コンピュートやインファレンスタイム・コンピュートですな。推論能力を向上させるために、推論時にコンピュートを使用するわけです。実際、Googleはこの方向に進む可能性があるという論文を発表しとります。
記事でも述べられとるように、これは主要な大規模モデルを開発してる企業全体で起こっとる現象です。つまり、企業が従来のLLMモデルから離れて、インファレンスやテストタイム・コンピュートに移行し始めとるということは、次世代モデルの方向性についてまたOpenAIがリードすることになるということですな。
小規模なイベントのスクリーンショットを見たんですけど、Google AI StudioのリードプロダクトでGoogle G APIとAGIを担当してるLogan Kilpatrickが、まさに我々がどこに向かっとるかを示してくれました。プレゼンテーションにはGoogle's Gemini 2.0って書かれとって、次世代フロンティアモデルはまだ決定されてへん段階やと。全てをチューニングする機能もあって、もちろんGemini 2.0 VOイメージや3、それにNotebook LMなどもあります。少なくとも次世代モデルがGemini 2.0になることは確実ですし、どんなものを期待できるかもある程度分かってきました。
たとえこれらのモデルの推論能力が期待ほど凄くなかったとしても、Googleはいろんな機能を提供する能力が著しく過小評価されとると思います。例えば、使い勝手が良くないかもしれませんが、Google AI Studioを使うと、音声、動画、画像など様々な入力ができて、1時間もの動画や音声も扱えるんです。これは他の主要プラットフォームにはない機能です。
なので、その点でGoogleを過小評価するべきやないと思います。まだまだ真面目なイノベーションがあるわけですからね。それに、Jimmy Applesの暗号めいたツイートもあって、これが結構興味深いんです。Googleのモデルについて語っとるんですけど、なぜJimmy Applesの発言を引用したかというと、先週にAnthropicがAPI関連とエージェント的な何かをリリースすることを知っとった人物やからです。
彼は「誰かが酔っ払って、Gemini 2.0は既に選ばれたB2B顧客向けに展開されとると言うたけど、酔っ払いの戯言かもしれへん」って言うてます。正直、彼の発言の意味を解読するのは難しいときがあるんですけど、もしかしたらGemini 2.0は既に初期テスト用に特定のB2B顧客に提供されとるのかもしれません。
大手企業がこういうことをするのは初めてやないですし、Googleはモデルが特定のシナリオで「ウォーク過ぎる」と判断された際の批判を避けようとしとるのかもしれません。でも、それが私の一番の懸念やないんです。私が気にしとるのは、これらのモデルが期待に応えられるかどうか、そして実際にAIエコシステムの中で人々の日常的な使用の一部になれるかどうかです。
先ほども言いましたように、たとえこれらのモデルが期待通りの成果を出せへんとしても、Googleは様々な分野でこのAIレースに勝つと思います。例えば、Character.aiを離れるために法外な金額を支払われた有名なAI研究者のNoomが、OpenAI 1を進化させるための別の推論モデルに取り組んでるという噂も聞いとります。ただし、Googleはこの話についてはコメントを控えとります。
Noomがこれに取り組んでるかどうかは分かりませんが、Googleが高度なAIモデルに取り組んでるのは間違いないでしょう。というのも、GoogleはAIの一つの側面だけに取り組んでるわけやないからです。長文コンテキストのイノベーションをもたらしたのもGoogleやし、これらのAIシステムをより有用にするような他のブレークスルーも続けて生み出してます。
ただ、これらが製品としていつ提供されるかは分かりません。最近のイベントでGoogleが発表したことで、人々が忘れとることがいくつかあって、Googleがパイプラインに持っとるものについて少し思い出してもらいたいと思います。みんなGoogleが素晴らしい会社で、軽視すべきではない多くのものを持っとることを忘れがちですからね。
そして、最後に皆さんにお伝えしたいのは、もしGoogleのGeminiを使ってへん方がいらっしゃるなら、ちょっと考え直してみた方がええかもしれませんよ。実は見逃されとることの一つがあって、当時は私も気付かんかったんで動画も作らんかったんですけど、後になって分かったニュースがあるんです。
GoogleはGoogle Gemini Proのアップデート版をリリースしとって、これが数学や自然なコードモードを含む様々なベンチマークで著しく良いパフォーマンスを示したんです。MMUやmath vistaなど、他のモデルが太刀打ちできへんベンチマークでも、このモデルは非常に優れた性能を発揮してます。これはGoogle Gemini 1.5 Pro 2ですね。
なので、Google AI Studioに行って、Googleのより高度なモデル、実際に使える方のモデルを見てみたい場合は、AI Studioに行くことをお勧めします。Googleのプロダクトやサービスを最大限活用するには、そこが最適な場所やと思います。
さて、これらについてどう思われます? まだGoogleは勝負できると思いますか? 私は全く見限ってませんよ。結局のところ、パイプラインには様々な製品があるし、最近デビューしたNotebook LMは多くの人を驚かせ、満足させましたからね。
ほな、皆さんの意見を聞かせてください。コメント欄でお待ちしとります。また次回お会いしましょう。

いいなと思ったら応援しよう!