サム・アルトマンは「ここからのAIの進歩は途方もないものになる、Llama 3.1はすでに打ち負かされた！Googleのニュース..」

2024年7月28日 06:47

サム・アルトマンが本日からAIの進歩が途方もないものになると述べ、Googleが彼らのフロンティアモデルに関する驚くべき発表を行い、さらにLlama 3.1というオープンソースモデルを凌駕する別のモデルについても発表しました。今週のAIに関して皆さんが見逃したかもしれないニュースがたくさんあります。
今週実際に得られた最初のニュースの1つで、かなり興味深いものはサーチGPTです。もしご存じなければ、従来の検索システムよりもはるかに優れたウェブ検索ができる製品への実際の需要がありました。Googleを使ったことがある人なら、現在それがもはやそれほど良くないことをご存知でしょう。そして今や、本質的にサーチGPTは、AIシステムを使って検索し、必要なものだけを簡単に見つけられる関連ソースを見つけるのです。
ここで見て分かるように、基本的に必要なものを何でも検索でき、すべてを即座に見つけることができます。これが大部分において検索の未来だと私は思います。Googleも実装を試みましたが、彼らの功績として、それはリリースの準備ができていませんでしたが、それでも他の人々との競争の中でリリースしようとしました。
本質的にこれについて驚くべきことは、彼らが実際にサーチGPTを少数のユーザーと出版社でテストしてフィードバックを得ていることです。このプロトタイプは一時的なものですが、将来的にはこれらの機能の最良の部分を直接ChatGPTに統合する計画です。もちろん、プロトタイプのテストに興味がある場合は、実際に待機リストに登録できます。
ここで基本的にこれがどのように機能するかを見ることができます。そして、今すぐ使えるツールを皆さんにお見せしようと思います。これは実際にサーチGPTと同じくらい効果的なものです。これを使いたい人のためです。なぜなら、今オンラインで使える同様のツールがいくつかあり、その1つが実際にかなり人気があるからです。
私たちはAI空間でこのようなツールがますます人気になるのを見ることになると思います。なぜなら、現在の大規模言語モデルが得意とすることの1つは、大量の情報を要約することだからです。そして検索とは何でしょうか？それは多くの異なる情報の断片です。それを要約し、リンクを要約すると、かなり効果的なものが得られるのです。
ここで、誰かがノースカロライナの音楽フェスティバルなどを検索しているのが見えます。これが行われる検索の種類です。実際にこれにアクセスした人もいます。ですので、これは登録した人は電子メールをチェックしたいものです。なぜなら、今日実際にアクセスを得た人もいるからです。登録した場合は、電子メールをチェックしてください。今日アクセスがあるかもしれません。
しかし、実際に使えるクイックツールをお見せしましょう。これは実際にこれと同じくらい効果的です。実際、これよりも少し効果的だと思います。例えば、完全に何でも聞くことができます。現在の最先端のLLMモデルは何かと聞くことができます。そして、クエスチョンマークを付けるだけでいいのです。何かを正確にスペルする必要もありません。
ご覧の通り、それは研究し、いくつかのソースを取得しています。2024年のトップ大規模言語モデルが表示され、これらすべての結果が表示されます。これは本当にクールです。ほとんどの方はおそらくperplexityについて聞いたことがあるでしょう。ここで見られるように、リンクが提供されており、コピーしてペーストすることができます。もちろん、ソースのクレジットを付けたい場合は、そのリンクをクリックすればいいのです。
そして、もちろんできることは、このテキストをすべてコピーすることです。これをコピーして記事に貼り付けたり、共有したり、書き直したりできます。このモデルやあのモデルで書き直してと言うこともできます。そして、他の質問で続けることができます。これは私が毎日使っているものです。
GPT検索がこのレベルに達すれば、ほとんどの人はおそらくChatGPTよりもこちらを選ぶでしょう。はい、これには悪い点もありますが、もし積極的にトピックについて研究をしているか、少し曖昧なことについて研究をしていて、直接的な質問をしたい場合、これは本当に良いものだと思います。なぜなら、時々Googleに直接的な質問をしても、検索結果が役に立たないことがあるからです。
Googleは実際に今週たくさんのニュースをリリースしました。彼らが実際にリリースしたものの1つは、1.5 Flash in Geminiです。1.5 Flash in Geminiについて実際に話している理由は、これが実際に無料で、これはクールです。なぜなら、これは本当に速いモデルで、4倍長いコンテキストウィンドウを持っており、アプリ上でこれは驚くほど速いからです。
もしGeminiを使いたいけど、Proサブスクリプションに登録したくないと思っていたなら、私のように多くのAIサブスクリプションを持っていない人がほとんどだと知っています。しかし、そのサブスクリプションに登録したい場合は、今すぐGemini Flashを無料で利用できます。アプリでそれを使用できるはずです。今日230の異なる国で利用可能です。
次に、Googleが素晴らしい驚異のAlpha ProofとAlpha Geometry 2を発表しました。これは文字通り、ある人々にとって不可能だったことを実現しました。本質的に、彼らは国際数学オリンピックの問題を銀メダリストレベルで解決した最初のAIを発表しました。
実際にこれについてより長いビデオを作る予定です。なぜなら、これの意味は実際に驚くべきものだからです。研究をしていて、これがあれにつながり、あれがあれにつながることがわかりました。これは大変なことです。ほとんどの人がすぐに使える実際の製品ではないと述べるつもりはありませんが、これは人々がかなり過小評価しているものです。
しかし、皆さんに言わなければならないのは、これは本当に本当に驚くべきことだということです。これが銀メダルを獲得し、金メダルまであと1ポイントだったという事実は狂気じみています。なぜなら、metaculus（予測ウェブサイト）でほとんどの人が持っていた主要な予測の1つは、基本的に2025年までにブロンズメダルを獲得できるかどうかを疑問視していたからです。そしてAIは基本的に2024年に金メダルに近い銀メダルを獲得したのです。
これは、数学的推論の新しいフロンティアであり、Googleは信じられないほどの研究を行っています。これについては別のビデオで深く掘り下げます。おそらく数日後にそのビデオをリリースするでしょう。しかし、物事がクレイジーになろうとしていることを知っておいてください。
これは、サム・オルトマンも同じ見解を共有しているところです。ここからAIの進歩は途方もないものになり、AIは重要な国家安全保障の問題になるでしょう。私はワシントン・ポストに、なぜアメリカが権威主義政府に真空状態を残すのではなく、AIの開発でリードを維持する必要があるかについての寄稿を書きました。
これが記事です。「AIの未来を誰が制御するのか：人工知能に対する民主主義的ビジョンが権威主義的なものに勝たなければならない」
この記事全体はサム・オルトマンによるものです。彼は、これが私たちの時代の緊急の問題だと言っています。人工知能で急速な進歩が行われているということは、私たちがどのような世界に住むかについて戦略的な選択に直面しているということです。
それは、アメリカと同盟国が技術の利益とそれへのオープンなアクセスを広げるグローバルAIを推進する世界になるのか、それとも私たちの価値観を共有しない国や運動がAIを使って彼らの力を固め、拡大する権威主義的な世界になるのか。第三の選択肢はなく、どちらの道を選ぶかを決める時が来ています。
アメリカは現在開発でリードしていますが、継続的なリーダーシップは決して保証されていません。権威主義的な政府は追いつき、最終的に私たちを追い越すために莫大な金額を喜んで使います。ロシアの独裁者ウラジミール・プーチンは、AIレースに勝つ国が世界の支配者になるだろうと暗く警告しています。そして中華人民共和国は、2030年までにAIのグローバルリーダーになることを目指していると述べています。
明らかに、ここで私たちが述べている/見ているのは、これらの他のグローバルリーダーたちがAIが持つ真の価値を本当に理解しているということです。私は、あなたや私が恩恵を受けることができる知識を分配するなど、そういった素晴らしいことに関する価値について言っているのではありません。私が言っているのは、これまでに私たちが持っていたものよりもはるかに優れたシステムへのアクセスを持つことが、これらの他国のリーダーたちが急いで向かっているものだということです。
彼らがスピードを落とすことはありません。そして私たちは、彼らがAIでリードを取ることになれば、物事が急速に暗くなる可能性があるため、このリードを確実に維持する方法を見つけなければなりません。もし彼らがAIでリードを取れば、彼らは米国企業や他国に対して、ユーザーデータを共有するよう強制し、その技術を利用して自国民をスパイする新しい方法を開発したり、他国に対して次世代のサイバー兵器を作り出したりするでしょう。
それが何か奇妙な未来のように思えるかもしれませんが、私はこういったことが遠い将来のことだとは思いません。つまり、兵器システムや新しい技術を設計し、数行のコードで国家を、そして経済を不安定化させることができる超知能システムを想像してみてください。これらは本当に起こりうることなのです。
つい先日、単純なソフトウェアの更新だけで、経済の特定の部分がクラウドストライクを受け、物事が停止するのを私たちは目撃しました。外国の国からのサイバー攻撃がもっと大規模なことを引き起こす可能性があることを想像してみてください。これらは私たちが本当に考えなければならないことです。
すでに起こっていることの1つは、多くのこれらの権威主義的な政府がすでに自国民をスパイしていることです。そして信じてください、そのような技術が権力を持つ人々の手に広まることは望まないでしょう。
ここで彼は、AIの最初の章はすでに書かれていると言っています。ChatGPTやCopilotのようなシステムは限定的なアシスタントとして機能していますが、もちろんさらなる進歩がまもなく続き、人類社会の歴史の決定的な時期を迎えることになるでしょう。
ここではたくさんのことが起こっています。彼はAIのための国際原子力機関のようなものを作ることについて過去に話したことがあると述べていますが、それは可能性のある1つのモデルに過ぎません。1つの選択肢は、日本や英国などの国々で構築されているAI安全研究所のネットワークを結びつけ、民主的なAIプロトコルを遵守することを約束した国々が国内のコンピューター能力を拡大するために引き出すことができる投資ファンドを作ることです。
AIの未来についてここで議論されている多くの異なることがあります。これが実際にどのように機能するかを理解するのは本当に難しいでしょう。なぜなら、多くの人が言っているように、これは力の戦いだと思うからです。これらの超知能システムを制御する者が世界を制御することになるでしょう。最近でも、過去数年のAI開発を正確に予測した人が、AGIに達し、その後すぐにASIに達したら、1〜2年以内に、それを持たない人々に対して神のような力を持つ可能性が非常に高いと基本的に言っていたビデオを作っていました。そこにはあらゆる種類のクレイジーな含意があります。
次に、NVIDIAからAudio Flamingoが登場しました。これは転写を超えて音声を理解するモデルです。ここにNVIDIAのAudio Flamingoモデルがあります。そしてもちろん、ボリュームを上げてAudio Flamingoがそれらのシーンを語るのを聞いてくださいと言っています。
想像を超えた場所で、地平線が天国にキスをするところで、一人の男が冒険に出ます。彼は知恵と不屈の精神だけを武器に、星々の向こうにある謎への答えを求めて旅立ちます。私はその音声をどれだけ聞いたかわかりませんが、実際にかなり小さかったです。
本質的に、ここにあるのは、音声の転写を超えて、音声を真に理解できる新しいAIツールです。これは異なります。なぜなら、それは私たちが異なるレベルで音声を理解することを可能にするからです。Audio Flamingoは本質的にシーンを語り、基本的に何が起こっているかを正確に教えてくれます。
これは単に音声を説明するだけのものではありません。本質的に、この声はどのような種類のシーンで使用できるかを尋ねることができます。つまり、声がどのようなものか、どのように機能するかを説明することができ、どのような種類の声がどのような種類のシーンで使用されるべきかについての理解を持っています。
もちろん、この最初の部分で本当に素晴らしいと思うのは、この音声で主に何を聞くかと尋ねると、音声を通じて断続的に話す男性の声を主に聞くと言っていることです。
本当にクールだと思ったのは、これが実際に背景ノイズを簡潔に説明できることです。基本的に、背景ノイズは音声全体を通して連続しており、それは屋外環境の周囲の音である可能性があると言っています。
時々、音声クリップで何かを聞き取れないことがあるかもしれませんが、Audio Flamingoに「ここで聞こえたこの音は何？これは何に使われるべき？この音はここで使われるべき？」と尋ねることができるかもしれません。このような種類のモデルは実際にかなり魅力的だと思います。これは実際に私が予想していなかったものです。そしてこれは実際にNVIDIAからの本当にクールなものです。だから今日のビデオにこれを含めたかったのです。
そしてもちろん、イーロン・マスクが言っています。メンフィスにあるXの新しいスーパーコンピューターは、わずか19日で設置され、Grok 3の訓練に使用されます。これは12月までに期待されており、世界で最も強力なAIになるでしょう。
私たちは、5年、10年、20年前からある企業と比較して、多くのキャッチアップをする必要があります。私たちは急速にキャッチアップしています。Xの改善の速度は、他のどの企業よりも速いと思います。
私たちは先ほど言及したように、メンフィスに巨大な新しい訓練センターを設置し、オンラインにすることができました。そしてハードウェアの設置開始から訓練開始まで、わずか19日でした。これは間違いなく、誰もがそれを行うことができた中で最速です。だから私たちは速く動いていますが、まだキャッチアップしています。
Grok 2は実際に訓練を終了しました。Grok 2は約15,000個のGPU、H100で訓練されていました。Grok 2は約1ヶ月前に訓練を終了しました。私たちは微調整と呼ばれるものを行っています。バグ修正などです。だからGrok 2をリリースします。これはGPT-4と同等か近いものになるはずです。それを来月リリースする予定です。
次に、メンフィスのデータセンターで行っているのは、実際にGrok 3を訓練していることです。それは約3〜4ヶ月で訓練を終了し、その後微調整とバグ修正などがあります。Grok 3を12月までにリリースすることを希望しています。そしてGrok 3はその時点で世界で最も強力なAIになるはずです。
イーロン・マスクは本当に彼のコンピュート・スタックを積み上げています。ここで彼が言っているのがわかります。XAIチーム、Xチーム、そしてNVIDIAのサポート企業がメンフィスのスーパークラスターの訓練を午前4時20分に開始したことは素晴らしい仕事だと。そしてもちろん、彼は言います。10万台の液冷H100を単一のRDMAファブリック上に持つこれは、世界で最も強力なAI訓練クラスターです。
これはかなりクレイジーになるでしょう。なぜなら、これらのフロンティアラボにいる多くの人々は、はい、コンピュートが新しい石油になるだろうと認識しているからです。そしてモデルを急速に訓練し、それらのモデルの連続的な反復を行うことができることが、AIで競争力のある優位性を維持する上で重要になるでしょう。
だから、これが同じままであるかどうか疑問に思います。なぜなら、もちろんマイクロソフトのコンピューターがまもなくオンラインになるからです。彼らはゆっくりとコンピュートを構築しています。私はそれについてのビデオを持っています。多くの人々が見逃した本当に重要な詳細がいくつかありますが、彼らもまた巨大なAI訓練クラスターを構築しています。
これらのスーパーコンピューターが完全に構築された時点で、どれくらいの頻度でモデルのアップグレードを得ることになるのか疑問に思います。そしてこれが本当にタイムラインを加速させると思います。なぜなら、以前はGPT-4の訓練に本当に長い時間がかかりましたが、これらのスーパーコンピューターがオンラインになり、これらのチップの効率が向上すると、モデルの訓練が数ヶ月から1〜2ヶ月になる可能性があります。
これは、より多くのモデルが訓練されることを意味し、製品リリースのサイクルがより速くなり、モデルの世代が進化することを意味します。だから、それがどのように展開されるかを見るのは本当に興味深いでしょう。
これは、ほとんどの人が見逃したものであり、これは残念です。なぜなら、私はこのモデルをテストし、それが良い、本当に良いからです。
今日、私たちは私たちのフラッグシップモデルの新しい世代であるMistral Large 2を発表します。その前身と比較して、Mistral Large 2はコード生成、数学、推論において著しく優れています。また、より強力な多言語サポートと高度な関数呼び出し機能も提供します。
Mistral Large 2は狂気じみています。これは狂気じみています。なぜなら、もしあなたが知らないなら、これはLlama 3.1 7B（70億パラメータ）がリリースされた翌日にリリースされたオープンソースモデルだからです。そしてもちろん、Llama 3.1 45B（450億パラメータ）です。
ここで見ることができますが、Mistral Largeは実際に新しいLlamaよりもパラメータが少ないですが、これらのタスクでずっと良いパフォーマンスを発揮しています。これは狂気じみています。なぜなら、より少ないパラメータでより効果的なモデルを得られることを意味するからです。これは全体的に効果的です。
これは絶対に信じられないことです。私はこれを個人的なベンチマークで、私が行う特定のタスクに使用しました。そして通常これらのタスクを正しく行うのに苦労するモデルがありますが、これらの小さなモデルが実際に推論の面で向上し始めていることに驚いています。
これは魅力的です。なぜなら、時々私はこれらの700億、80億パラメータのモデルを見て、「ああ、これらのモデルは彼らの調子を尋ねるのにしか良くない」と思っていました。そして時々、複数のステップを含む非常に難しい質問を彼らに尋ねると、時々彼らはそれを正しく答えることができます。私は「これはかなりクレイジーになるだろう」と思います。なぜなら今、他のどこよりもはるかに安価なモデルを持っているからです。
これは、特定のパイプラインやワークフローにこれをより効果的に組み込むことができることを意味します。Mistral Large 2は、おそらく現在存在する最も過小評価されているモデルの1つだと言えるでしょう。
ここで見ることができますが、現在、human-evalでは本当に良いパフォーマンスを発揮しています。議論の余地はありますが、基本的にGPT-4の0すぐ隣にあります。これらの他のベンチマークでもかなり効果的であることがわかります。
ここで見ることができますが、平均的にはPython、C++、Java、TypeScript、PHPなどでほぼGPT-4の0の下にあります。コーディングにも実際に非常に効果的です。
これは非常に興味深いテストになり、どれほど効果的かを見ることになるでしょう。しかし、間違いなく皆さん、どのようなAIホスティングプラットフォームを使用しているかにかかわらず、これをテストしてみることをお勧めします。それはpoe（Anthropicのチャットボット）かもしれません。perplexity（検索エンジン）かもしれません。grok（テスラのAIチャットボット）かもしれません。しかし、Mistral Large 2オープンソースは狂気じみたものになるでしょう。
これが素晴らしいだけでなく、これの微調整されたリリースがいくつか出てくることを知っています。これを微調整する人々が出てくるでしょう。だから、エコシステムがこれで何をするのか楽しみです。
そして、ここにマーク・ザッカーバーグがAIエージェントの数十億について語っています。私は、最終的に数億、数十億の異なるAIエージェントが存在する世界に私たちは住むことになると思います。おそらく世界の人口よりも多くのAIエージェントが存在することになるでしょう。
私たちが焦点を当てているのは、すべてのクリエイターとすべての小規模ビジネスに、自分自身のAIエージェントを作成する能力を与えることです。プラットフォーム上のすべての人が、自分が対話したいと思うAIエージェントを作成できるようにすることです。
考えてみると、これらは巨大な空間です。世界には数億の小規模ビジネスがあります。そして私が本当に重要だと思うことの1つは、基本的に比較的少量の作業で、ビジネスが基本的に数回のタップで自分自身のAIエージェントを立ち上げることができるようにすることです。
カスタマーサポート、販売、すべての人々、すべての顧客とコミュニケーションを取ることができるAIエージェントを立ち上げることができます。私は、将来的にはすべてのビジネスが、今日のようにメールアドレス、ウェブサイト、ソーシャルメディアのプレゼンスを持っているように、顧客が話せるAIエージェントを持つことになると考えています。
そして、将来的にAIエージェントがそこにいるという未来は、そんなに遠くないと思います。そして、それはソーシャルメディアアカウントを持つのと同じくらい普通になると思います。
これが、未来が単に数十億、数十億のAIエージェントがお互いに対話し合う世界になる理由だと思います。ソーシャルメディアにいるすべての人、すべてのビジネスに基づいて、彼らは対話し、情報を交換しています。これは非常に効果的な経済になると思いますし、それがどのように機能するか見るのは本当に興味深いでしょう。
また、ご存知ない場合は、Clingというテキストから画像、または画像から動画、あるいはテキストから動画のモデルがあります。このモデルは実際にグローバルに利用可能になりました。Clingのアカウントを作成するだけで、このモデルをテストできます。ほとんどの人がこのモデルがどれほど効果的かを実際に見たいと思っていたことを知っています。
これはクレイジーです。この技術が利用可能になったことは絶対に狂気じみています。この技術がここにあることにまだ驚いています。そして、創造的な個人が実際に何を作り出すのか待ちきれません。なぜなら、多くの場合、人々は予算や創造的自由に苦労していますが、ここではMidjourneyの画像を取ることができ、それは信じられないほどです。それが実際に現実のものだとは信じられません。
私は本当に車が好きですが、ここで見ることができるのは、これが信じられないということです。これは信じられないものです。つまり、流体を見てください。これがAIによって生成されたという事実は... 私はまだこれがAIによって生成されたという事実を処理しています。なぜなら、これは来年起こると思っていたからです。しかし、これが今年この品質で起こっており、ここで今すぐ利用可能であり、コンピューティングの問題さえないという事実は本当に驚きです。
はい、無料でサインインしてアカウントを作成できます。それを踏まえて、今週のAIを楽しんでいただけたなら、ビデオにいいねを忘れずに押してください。私が見逃した特定のことがあれば教えてください。そして、ビデオを楽しんでいただけたなら、次回またお会いしましょう。

この記事が気に入ったらサポートをしてみませんか？