見出し画像

サム・アルトマンがついにGPT-5について明かす(GPT-5の説明)

5,438 文字

ようやくGPT-5のロードマップが公開されました。今回の動画を収録することに私が特に興奮している理由は、これまでのような憶測的な情報ではなく、GPT-5の完全なロードマップが私たちの理解のために提示されたからです。
それでは時間を無駄にせず、GPT-5がどのようにデプロイされるのかについて詳しく見ていきましょう。この情報からは、将来のAIシステムがどのようになるのかについて興味深い示唆が得られます。私もこれが主要なチャットボットプロバイダーにおけるAIシステムの姿になると考えています。
数時間前、サム・アルトマンはGPT-4.5とGPT-5の公式ロードマップ更新についてツイートしました。彼は、意図したロードマップの共有をより良くし、製品提供をよりシンプルにすることを望んでいると述べています。AIがユーザーのために機能することを望み、モデルと製品提供が複雑化していることに気付いたと言っています。
つまり、ChatGPTを使用したことがあり、多額の投資をしている人、例えば最上位のプランを利用している人にとって、現在のChatGPTは完全な混乱状態だということです。具体的に説明しましょう。
ChatGPTにアクセスすると一見シンプルに見えますが、このドロップダウンメニューを開くと、おそらく皆さんとは異なるレイアウトですが、私の場合、GPT-4 miniと一時的なチャットを含めると9つものオプションがあります。
この問題は分析麻痺を引き起こします。つまり、ユーザーの決定に影響を与えるのです。AIチャットボットを使用しようとする人は、どのモデルが最適なのか本当に分かりません。GPT-4、GPT-4o、GPT-4o1、GPT-4o3 mini、GPT-4o3 mini high、GPT-4o1 prom modeなど、選択肢が多すぎるのです。
製品選択において、選択肢が多すぎると製品は失敗するとよく言われます。ChatGPTの場合、これは一般ユーザーにとって複雑すぎるため、彼らはこれを全体的にシンプル化したいと考えています。私のような各タスクに適したモデルを理解している人にとっては問題ありませんが、一般ユーザーにとってはむしろ不利益であり、良いことではありません。
彼らは後ほど説明する非常に興味深い方法でこれを変更する予定です。彼らも私たちと同様にモデル選択を嫌っており、魔法のような統一された知能に戻りたいと考えています。
この統一された機械知能に戻るためのアプローチの一つは、ルーターLLMを通じて行われると考えています。これはフレームワークとは言えませんが、物事をより簡単にするためのLLMのセットアップ方法です。
単一のシステムプロンプト、つまりユーザープロンプトがあります。例えば「今日の天気は?」というプロンプトを入力すると、入力されたすべてのプロンプトを分析するルーターがあります。このルーターは質問を分析し、コストやレイテンシーを考慮し、その質問が難しいモデルに送られるべきか、2秒以内に答えられる簡単なモデルに送られるべきかを判断します。
難しい質問の場合は、長時間考える最も集中的なLLMに送られ、「卵が先か鶏が先か」のような非常に単純な質問は、シンプルなモデルに送られます。そして最終的にシステムの応答が得られます。
これは以前にテストされたことがあります。OpenAIではないかもしれませんが、他の企業がルーターLLMのようなものをテストし、コストを約85%削減できたという非常に良い結果が出ています。
このブログ記事「Route-LLM: コスト効率の良いLLMルーティングのためのオープンソースフレームワーク」で詳しく読むことができます。彼らのルーティングセットアップでは、より強力で高価なモデルと、より弱いが安価なモデルという2つのモデルのケースに焦点を当てており、2つのモデル間で高品質を維持しながらコストを最小限に抑えることを目指していました。
彼らは「私たちの重要な目標の一つは、Oシリーズモデルとgptシリーズを統合し、すべてのツールを使用でき、長時間考える必要があるかどうかを判断し、一般的に幅広いタスクに役立つシステムを作ることです」と述べています。
先ほど説明したRoute-LLMフレームワークのように、私たちはおそらくオールインワンのシステムを手に入れることになるでしょう。将来のモデルはオールインワンシステムとして提供される可能性が高いと思われます。システムの一部にO3 miniやO3 highなどが含まれるかもしれませんが、基本的には1つの巨大なモデル、あるいは統一された知能レベルを提供するLLMの調整されたセットに向かっているようです。
おそらく、あなたの契約プランに応じてそれらの知能レベルにアクセスできるようになるでしょう。月額200ドルを支払えば、モデルの脳全体、つまり高度な推論能力のすべてにアクセスできますが、無料ユーザーの場合は1日に1、2回の質問、あるいは1日10〜20回程度のクエリに制限されるかもしれません。
6つの異なるモデルを持ち、他の企業が異なるモデルをリリースしたときに「このモデルは明らかに優れている」というような状況よりも、このようなデプロイ方法の方が容易です。これはOpenAIのブランディングにとってもより良いでしょう。
彼らは、ChatGPTとAPIにおいて、O3を含む多くの技術を統合したシステムとしてGPT-5をリリースすると述べています。O3は単独のモデルとしてはリリースされないとのことです。
つまり、GPT-5はO3をその構造の一部として吸収し、かなりの期間そのモデルの一部となる可能性が高いということです。GPT-5は、おそらくO3、O1、異なる質問に対応する異なる部分で構成されるシステムになるでしょう。このシステム全体がどのように機能するのか、非常に興味深いですね。
サム・アルトマンが述べた別の興味深い点は、GPT-5をシステムとして位置づけていることです。彼は「多くの技術を統合する」と言っていますが、現在持っているすべてを含むのかどうかは分かりません。以前、アルトマンは今年、誰も考えていないようなものをリリースすると言及していました。これは非常に興味深いと思います。
おそらくGPT-5はコンピュータエージェントにもなるでしょう。それが理にかなっているので、その名前の下に包含されると思います。これは非常に興味をそそられます。モデルが非常に賢いことは分かっていますが、GPT-5の最終バージョンがどのようなものになるのか想像もつきません。
彼らは次に、内部的にOrionと呼んでいたGPT-4.5を、思考の連鎖を持たない最後のモデルとしてリリースすると述べています。これは、データを収集し、モデルに投入し、トレーニングを行い、その後ポストトレーニング、ファインチューニングなど、GPT-4やGPT-4oのような標準的なモデル出力のために行うすべての古い訓練方法を使用する最後のモデルということです。
以前にも述べたように、私たちは新しいモデルトレーニングのパラダイムに入っており、GPT-4.5はおそらく私の推測では、Claude 3.5 Sonnetレベルになるでしょう。ただし、それよりもずっと優れているわけではなく、わずかに優れている程度でしょう。なぜならClaude 3.5 Sonnetは既に非常に優れているからです。
他のモデルがベンチマークでClaude 3.5を上回っているとしても、Claudeを使用すると、はるかに賢く、常に状況を理解しているように感じられます。OpenAIの目標は、おそらくClaude 3.5 Sonnetをわずかに上回ることだと考えています。
内部的にOrionと呼ばれていたGPT-4.5でそれを達成できると思います。このモデルが賢いことは分かっていましたが、以前にデプロイしなかった理由(多くの人が疑問に思っていた)は、推論のコストが高すぎて、まだモデルを提供できなかったからです。
しかし、時間が経つにつれて推論コストは着実に低下していきます。昨日の動画で話したように、サム・アルトマンは12ヶ月ごとにLLMの価格が約10分の1に低下すると述べています。モデルのトレーニングと安全性テストを行ってから数ヶ月の間に、推論の価格が合理的なレベルまで低下し、このモデルをリリースできるようになったと考えられます。
推定到着時期については、数週間から数ヶ月とされています。GPT-4.5やGPT-5のETAについて、GPT-4.5は今後数週間でリリースされる可能性が高く、3月末までには利用可能になると予想されます。GPT-5については、第2四半期末か第3四半期末までと推測されますが、これは私の最善の推測です。
無料ユーザーについては、ChatGPTの無料プランでGPT-5の標準的な知能設定での無制限チャットアクセスが提供されます。ただし、これは高度な知能ではないことに注意してください。O3 mini highのような長い思考の連鎖や、現在アクセス可能な最高の知能レベルにはアクセスできません。
これはDeepSeekが、非常に高度な知能を格段に低いコストで提供し、他のものよりもDeepSeekを使用する方がコスト効率が良くなったことへの対応と思われ、非常に興味深い動きです。
Plusサブスクライバーは、より高いレベルの知能でGPT-5を実行できるようになり、おそらくモデルがより深く考え、クエリに対してより深い洞察を提供する長い思考の連鎖にアクセスできるようになります。
Proサブスクライバーは、さらに高いレベルの知能でGPT-5を実行でき、これらのモデルには音声、キャンバス、検索、深い研究などが組み込まれます。OpenAIは基本的に、無料モデルへのアクセスは無料で提供しますが、音声、キャンバス、検索、深い研究へのアクセスを望む場合は、おそらく月額200ドル程度の最高レベルのプランを支払う必要があると言っているようです。
これはかなり高額に感じるかもしれませんが、OpenAIが期待しているのは、新機能をリリースするたびにGPT-5システムに追加していくことです。つまり、システムが賢くなればなるほど、実質的に支払う価値は下がっていくということです。
月額200ドルは確かに途方もない金額で、私の知人で、モデルからそれだけの価値を得られる人はいないと思いますが、確実にそうする人々はいるでしょう。OpenAIはペーパー使用料金についても議論しています。
また非常に興味深かったのは、「あなたはGPT-5より賢くなれるか」という質問に対するサム・アルトマンの回答です。彼は自身もGPT-5より賢くはならないだろうと述べています。
「GPT-4より賢いと感じている人はどれくらいいますか?GPT-5よりも賢くなれると思う人はどれくらいいますか?もっと手が挙がると思っていました。私はGPT-5より賢くなれるとは思いませんが、それについて悲しくはありません。なぜなら、それを使って素晴らしいことができるようになると思うからです。より多くの科学的成果を得たい、研究者ができなかったことを可能にしたいと考えています。これは人類の長い歴史の一部です。」
「今回は、これが可能にすることが少し異なって感じられますが、科学者たちが非常に高いIQを持つツールを使って、正しい質問を見つけることに集中し、より早く物事に取り組み、検索空間をより速く進められるなら、それは私たち全員にとって勝利です。私たちはそこに到達できることを非常に嬉しく思います。」
さて、GPT-5についてみなさんはどう思いますか?私は統一された知性に興奮しています。これらのモデルを1つの完全なものに統合することは、やろうとしている仕事とモデルのシンプルさの観点から非常に理にかなっていると思います。
マーケティングにおいて、皆さんがご存じないかもしれない有名な例があります。ビジネスの教訓として受け取ってください。あるジャムの店があり、24種類のジャムを提供する店と6種類のジャムを提供する店がありました。24種類の方が選択肢が多いため、より多くの人が購入すると思われましたが、実際に購入したのはわずか3%でした。一方、6種類の場合は30%の人が購入しました。
これは、選択肢が多すぎると実際には何も選べなくなることを示しています。AIも同じです。ChatGPTにGPT-4o1、O3 mini、O3 mini highなど多くの選択肢がある場合、問題が発生します。Claudeには3つのモデル、Geminiには1〜2つのモデルがありますが、実際にはGeminiでさえモデルが多すぎるかもしれません。
重要なのは、Claudeの場合、誰もがClaude 3.5 Sonnetを使用する1つのモデルとして知っており、DeepSeekの場合も、基本的なモデルである思考モデルを誰もが使用するということです。現状では選択肢が多すぎるため、将来的にはこれらが1つの大きなモデルのSLアーキテクチャに統合される可能性が高いでしょう。
以上、この動画を楽しんでいただけたと思います。では、また次回お会いしましょう。

いいなと思ったら応援しよう!