
サム・アルトマンがGPT-5を発表!「とてつもない高IQツール」
5,236 文字
OpenAIのCEOサム・アルトマンが、世界中の大学で講演する中で、開発中のモデルGPT-5について驚くべき詳細を明かしています。彼はGPT-5がすでに自分より賢いと主張し、AGIへの道のりが予想以上に順調であることを語り、さらにはOpenAIの秘密兵器についても明かしています。それは2025年末までに世界トップのコンペティティブ・プログラマーになり得る社内AIモデルです。詳しく見ていきましょう。
まず、ベルリン工科大学でのサム・アルトマンの講演から、GPT-5がどれほど賢くなると予想されているかについて見ていきます。
GPT-4より自分の方が賢いと感じる人はどれくらいいますか?では、GPT-5よりも賢いと思う人は?ここでもっと手が挙がると思っていたのですが。私自身、GPT-5より賢くないと思います。でもそのことを悲しく思っていません。なぜなら、私たちはそれを使って素晴らしいことができるようになるからです。より多くの科学的発見を実現したい、研究者たちが今までできなかったことを可能にしたい、これは人類の長い歴史の一部なのです。
今回は少し違う感じがするかもしれません。なぜなら、これが可能にすることのためです。しかし、科学者たちが、とてつもない高IQツールを手に入れ、正しい質問を考えることにより焦点を当て、より早く問題に取り組み、探索空間をより速く進めることができるなら、それは私たち全員にとって勝利なのです。だからこそ、私たちはそれを実現できることを喜んでいます。
もちろん、人間の知性と人工知能は根本的に異なります。人間が得意とすることでAIには極めて難しいことがあり、その逆もまた然りです。例えば、AIはチェスでグランドマスターに勝ったり、複雑な数学の問題を数秒で解いたりできますが、洗濯物を畳むといった単純なことをロボットにさせるのは、今でも非常に困難です。
サム・アルトマンがGPT-5は自分より賢くなると主張する時、重要な疑問が浮かびます。「賢い」とは実際どういう意味なのでしょうか?それはIQが高いということを意味するのでしょうか?主要なAIモデルのIQを追跡しているウェブサイトを見ると、そのスコアはあまり信頼できないように思えます。OpenAIのo1プレビューがIQ119でトップに立っていますが、同じモデルでより多くの計算能力を持つo1プロの方が逆に110と低いスコアになっています。これは筋が通りません。
そもそもIQテストはどれほど信頼できるのでしょうか?特にAIの知能を測る場合は。従来のIQテストは人間用に設計されており、推論、論理、パターン認識を機械知能には必ずしも当てはまらない方法でテストします。最高のAIモデルでさえ一貫性のないスコアを出しているのなら、IQをAIの能力を測る意味のある指標として使えるのでしょうか?
しかし、このビデオはIQスコアについてではありません。本当に重要なのは、GPT-5のような賢いAIモデルが、その知能を実世界でどのように活用していくかということです。それについて、次のクリップでサム・アルトマンがAGIへの道のりについて語っています。なぜ予想以上に順調だと考えているのか、そして今後数年間で何が期待できるのかについてです。
この時点で、AGIの正確な定義が重要になってきていると思います。あらゆる分野の世界的な専門家が休むことなく協力して働くようになった時、それは多くの人々がAGIと考えるものを超えているでしょう。
次の数年で、多くの人々が「コンピュータにそんなことができるとは思わなかった」と言うようなものが登場すると思います。そして、科学の進歩の問題、つまり1年で10年分の科学的進歩を達成できるようなものの登場は、もう少し先になりますが、それこそが世界が本当に急速に変化し始め、大きな恩恵を受け始める瞬間になるでしょう。
私たちは非常に急峻な軌道にいるように見えます。人々は悲観論者になりがちで、昨年は「スケーリングは終わった」「これはもう機能しない」といった話がたくさんありました。しかし、私たちは新しいパラダイムを見つけ、現在では本当に賢い推論モデルを持っており、それはしばらくの間スケールし続けるでしょう。その後、また別のパラダイムを見つけることになると予想しています。
一般的に学んだことの一つは、技術におけるこのような急峻な指数関数的曲線を見たとき、それに反対すべきではないということです。人々が「これはもうすぐ限界に達する」とか「あれは限界に達する」とか「この限界に突き当たる」と言い始めたときは、非常に懐疑的になるべきです。私たちには、本当に学習できるアルゴリズムという根本的なブレークスルーがあり、それは継続していくように見えます。確かに障害にぶつかり、それを乗り越える方法を見つけなければならないでしょうが、AGIとその先に到達すると思います。そしてここからは、かなり滑らかなスケーリングになるでしょう。
ここでいくつか注目すべき点があります。まず、アルトマンは、これらのAIシステムが科学的発見を加速し、例えば10年分の進歩が1年に凝縮されるようになったとき、世界は前例のないペースで本当に変化し始めると述べています。これは数年先の話かもしれませんが、私たちが乗っている急峻な軌道は、近い将来減速する兆しを見せていません。
彼が指摘したように、人々は「壁に突き当たっている」とか「スケーリングが限界に達している」と主張するでしょうが、大きな視点で見ると、AI の進歩は遅くなっていないどころか、実際には指数関数的に加速しているのが明らかです。
では、AIの進歩が遅くなっていないとすれば、この指数関数的な成長を推進しているものは何でしょうか?OpenAIのGPTシリーズでは、事前学習スケーリング則の台頭が見られました。高品質な学習データの量を増やし、モデルのパラメータサイズを拡大することで、直接的かつ予測可能に知能が向上します。
GPT-1からGPT-4まで、すべての新しいGPTモデルで、OpenAIはモデルサイズを約100倍ずつ増やしてきましたが、そのたびに100倍の計算能力が必要になります。したがって、GPT-4からGPT-5に進むには膨大な計算能力が必要になり、少なくとも現時点ではOpenAIにはそれがありません。
しかし、ここでOpenAIが発見した「テストタイム・コンピュート」と呼ばれる新しいスケーリングパラダイムが重要になってきます。巨大な事前学習に頼るのではなく、モデルが実際に質問に答える推論時により多くの計算能力を割り当てることで、特に推論能力において大きな性能向上につながることを発見しました。
また、この新しいスケーリング則は、より効率的なだけでなく、はるかに高速であることも分かりました。OpenAIの研究者ノーアン・ブラウンが先月投稿したように、「o1を発表してからわずか3ヶ月でo3を発表しました。この軌道は続くと確信しています」。
つまり、事前学習スケーリングに従うGPTシリーズのように1〜2年待つのではなく、数ヶ月ごとに新しいoシリーズモデルを見ることができるようになります。これは、事前学習時の計算(事前学習スケーリング)とテストタイム・コンピュート(推論時スケーリング)という2つのスケーリング則が働いているということです。そしてアルトマンが示唆したように、最終的には第3のスケーリング則が出現する可能性もあります。
しかし、ここで本当の疑問が浮かびます。OpenAIのような企業がAIインフラを構築するために5,000億ドルの資金を手に入れたらどうなるでしょうか?そのレベルの資金があれば、GPTシリーズとoシリーズのモデルをスケールアップするだけでなく、両方のスケーリング則を組み合わせて、さらに強力なものを作り出す可能性があります。
私たちは「スターゲート」と呼ばれる新しいプロジェクトを進めています。現在のコンピュータの約100倍の計算能力を持つもので、まさにその質問に答えたいと考えています。以前は事前学習だけを行うパラダイムでしたが、GPT-1、2、3、4のそれぞれが正確ではないにせよ、ほぼ100倍ずつでした。そしてそれぞれで大きな新しい創発的なものが生まれました。
内部的には、おそらく4.5くらいまで到達しています。5.5に到達するには、その100倍の計算力が必要になるでしょう。それについては後で触れますが、昨年、この分野で、少なくとも私たちにとって最も重要なことは、推論できる新しいモデルの出現です。これらは信じられないほどの新しい計算効率の向上をもたらし、多くのベンチマークで、以前の世界では GPT-6までかかると予測していたようなパフォーマンスを、はるかに小さなモデルで実現できるようになりました。これは強化学習によるものです。
私たちは今、その感覚を掴んでいます。ただし、この新しい方法で行うと、すべてが良くなるわけではありません。特定の次元では改善できますが、今では以前よりも賢く、もしはるかに大きなモデルを事前学習してこれを行った場合、どうなるかを予測できるようになりました。そのようなジャンプで期待できることは、本物の新しい科学的知識の最初の兆しです。
現在、GPT-4は...いや、それは簡単すぎるので、私たちの最新の最高モデルであるo3について考えてみましょう。これは信じられないほどよくプログラミングができますが、人々がすでに行ったことについては得意ですが、全く新しいアルゴリズムや新しい物理学、新しい生物学を発明することについては、それほど得意ではありません。それが次の2桁の進歩で得られるものだと思います。
本当に、私たちはまだ何も見ていないと思います。OpenAIのo1やo3モデル、あるいはGPT-4が優れていると思うなら、今後数年でモデルがどれほど驚異的になるか、ただ待っていてください。
先ほど触れたように、私たちは指数関数的な曲線上にいることを理解することが重要です。つまり、AIの進歩を見ているだけでなく、進歩の速度自体が加速しているのです。これが技術の仕組みです。わずか20年前は、高速インターネットにアクセスできる人はほとんどいませんでした。そして今では、AIアシスタント、自動運転車、2000年代初頭の最高のコンピュータを上回るスマートフォンを持っています。
今感じている興奮を不安に変えたくはありませんが、次のクリップでサム・アルトマンは、これらのモデルを全く新しいレベルでコーディングさせることについて、すさまじい進歩を遂げていることについて語っています。
最近のスケールでの進歩は本当に驚くべきものです。私たちの最初の推論モデルは、世界で100万番目のコンペティティブ・プログラマーレベルでした。人々はそれをとても印象的だと思いました。AIがこれを行う人々の中で100万番目に優れているなんて、かなりすごいと。その後、私たちは約1万位になるモデルを持ち、12月に公開したo3は世界で175位のコンペティティブ・プログラマーです。
私たちの内部ベンチマークは現在約50位で、今年の終わりまでに1位になるかもしれません。これは、この新しいパラダイムでの計算能力の増加による驚くべきスケールの比率です。そして、その勢いが止まる兆しは見えません。
確かにソフトウェアエンジニアにとっては厳しい時代になりそうですが、真面目な話、これは驚くべき予測です。2025年の終わりまでに、地球上で最高のコンペティティブ・プログラマーとなるモデルが登場するかもしれないと主張しているのです。
彼が言及しているこのテストやベンチマークが実世界のアプリケーションにどのように翻訳されるのかはわかりませんが、これはそれでもAI開発における重要なマイルストーンを表すことになるでしょう。AIモデルが世界最高のコンペティティブ・プログラマーを上回るパフォーマンスを発揮できるということは、これらのモデルが単なるツールではなく、エリートレベルで複雑なコーディングの課題に取り組める真の問題解決者になりつつあることを示唆しています。
この意味するところは、コーディングコンペティションをはるかに超えて、ソフトウェアエンジニアリングから科学的発見に至るまで、産業全体を完全に作り変える可能性があるのです。
以上で今日のコンテンツは終わりです。私たちは本当に新しい技術時代の始まりを目撃しています。おそらく人類が今まで経験した中で最大のものでしょう。そして、これは本当にまだ始まりに過ぎません。皆さんと一緒にこれがどのように展開していくのかを見るのが楽しみです。そういうわけで、次に来るものを見逃さないように、ぜひチャンネル登録をお願いします。