サム・アルトマン、衝撃!会社が「GPT-5の詳細を早期リーク」...
5,622 文字
最近1時間ほどの間にソーシャルメディアで情報が飛び交っとるんですわ。OpenAIの新しい騒動というわけやないんですけど、The Vergeみたいな媒体がプレスリリースに関連して、OpenAIが12月までに次の大型モデルをリリースする計画やという報道をしてはるんです。その中で、ChatGPTの2周年記念に合わせて、社内でOrionってコードネームで呼ばれてる次期主力モデルが登場するいうことなんですわ。
これが非常に興味深いんは、サム・アルトマンが直接この報道についてコメントしたのが珍しいからなんです。イーロン・マスク以外で、数十億ドル規模の企業のCEOが何が起こってるかについて直接コメントするのは珍しいことですわ。
サム・アルトマンの発言に入る前に、The Vergeが何を言うてはるのか、そして実際に何が本当で何が違うのかを詳しく見ていきたいと思います。OpenAIの秘密のモデル「Orion」についての話には、いくつか真実があると思うんですわ。
このThe Vergeの記事が特に興味深いのは、普段AIの情報を探す時にあまり参考にせえへん媒体やからです。普通は上位3つ、つまりストロベリー騒動を誰よりも早く報じて、当時みんなが本当かどうか疑うてた情報を出したReutersみたいな信頼できるソース、GPT-4やその他のOpenAIの機能について報じたBloomberg、そしてAIに関する最新情報を常に提供してくれるThe Informationのどれかを見るんです。
The Vergeみたいな会社から情報が出てくると、どうしても懐疑的になってまうんです。歴史的に見ても、Reuters、Bloomberg、The Informationしか見たことがなくて、The Vergeはそのリストに入ってへんのです。これは彼らの言うてることが間違うてるという意味やないんですけど、情報の一部が違うてる可能性はあるんです。
記事によると、OpenAIの最近の2つのモデル、GPT-4と01とは違って、OrionはChatGPTを通じて広く一般公開されへんらしいんです。代わりに、自社の製品や機能を開発するために、OpenAIと密接に協力してる企業に先に使わせる計画やと、事情に詳しい情報筋が言うてはるんです。
これは面白いですね。OpenAIがこういう形で企業と協力したことがあったかなと思うんですけど、OpenAIがこれをする唯一の理由は、これらのモデルが極めて強力やからちゃうかと思います。もちろん、配布はOpenAIが望んでることやし、企業もそれに注力しとるんですけど、OpenAIがこれを一般公開せんというのは、フィードバックや収益の面から見ても理にかなわへんように思えます。
もしこれが本当やとしたら、自社製品や機能の開発というよりも、安全性に関することちゃうかなと思います。OpenAIのリリースでは通常、安全性テストが必要で、それにはある程度時間がかかるんです。なぜなら、何らかの害を及ぼす可能性のあるものを一般公開してしまうと、OpenAIは訴訟のリスクにさらされる可能性があるからです。現に今でも複数の訴訟に対応せなあかん状況ですからね。
また、別の情報筋によると、OpenAIの主要パートナーであるMicrosoftのエンジニアたちが、早ければ11月にもAzure上でOrionをホストする準備を進めてるそうです。Orionは社内ではGPT-4の後継、つまり基本的にGPT-5として見られてるんですけど、実際に対外的にGPT-5って呼ぶかどうかはまだ分からんらしいです。
いつものように、リリース計画は変更される可能性があるし、遅れる可能性もあります。OpenAIとMicrosoftは、この記事についてコメントを控えてはります。
つまり、来月の11月という近い時期に、これらのデータセンターで大規模に展開するための準備をしてるエンジニアがいるということですわ。10月もあと数日で終わりですからね。
もちろん、Orionについては以前からちょこちょこ話題に上がってて、サム・アルトマンや業界の内部関係者によって微妙に示唆されてきたんです。この情報がより信頼できるんちゃうかと思う理由は、別のモデルを大規模に展開しようと思うたら、ワンクリックで展開できるようなもんやないからです。
大量のサーバーが必要になってきます。OpenAIが最近苦労してるのが計算能力で、最近でもMicrosoftから十分な計算能力を得られてへんって言うて、他の企業にも計算能力の確保を求めてるくらいです。
だから、これが完全に嘘やとは思えへんのです。おそらく今でも計算能力の拡大を進めてるはずやし、先ほど言うたように、サム・アルトマン自身からもヒントがあったので、名前についても完全に否定はできへんと思います。
ただ、もう一つのコメントについては、ちょっと言いにくいんですけど、正直ここからは話が少し制御不能になってきてる感じがします。もちろん、これはサム・アルトマンが最近「フェイクニュースが制御不能になってる」って言うたことへの反応として言うてるんですけど。
記事では、OpenAIの幹部がOrionはGPT-4の100倍もパワフルになる可能性があるって匂わせたって書いてあるんです。これはかなりの主張ですわ。100倍パワフルって言うても、どういう意味なんでしょう?サイズが100倍?賢さが100倍?
そもそもどうやって数値化するんです?推論ベンチマークで20%のスコアを出すモデルが、200%のスコアを出すってどういうことなんでしょう?100倍パワフルなモデルってAGIってことにならへんのかな?これはちょっと分かりにくいところで、おそらくここがフェイクニュースが制御不能になってるって言われる部分かもしれません。
もちろん、これは推測で、私が完全に間違うてる可能性もあります。正確には何が来るか分かりませんけど、最近見てきたモデルがそんなに大きなジャンプを見せてへんことを考えると、100倍パワフルっていうのはちょっと大げさな気がします。
ただ、これが誇張やと言うてる一方で、忘れてはいけないのは、サム・アルトマンが以前のインタビューで、GPT-4からGPT-5へのジャンプは比較的同じようなもので、科学的な確実性を持って、GPT-5はGPT-4よりもかなり賢くなり、GPT-6はGPT-5よりもかなり賢くなるって言うてはったことです。
まだこの曲線の頂点には近づいてへんし、何をすべきかも分かってる。これは一つの分野だけが良くなるんやなくて、この評価やこの科目、この形式だけが良くなるんやなくて、一般的な意味で賢くなるんです。その発言の重大さは、まだ過小評価されてると思います。
OrionがGPT-4シリーズの後継やとされてることを考えると、100倍パワフルなモデルが何をできるようになるのか、想像もつきませんわ。
興味深いのは、そしてこの部分は間違いなく正しいと思うんですけど、これは9月にOpenAIがリリースした01推論モデルとは別物やということです。01は、システムが段階的に問題を推論できるようにするエージェントの基本レイヤーとなる別クラスのモデルです。
これが別クラスのモデルやということは確実です。なぜなら、OpenAIが最近の放送で、次に何が来るのかについて話した時に実際に言及してはったからです。
主な結論として、GPT-4の100倍パワフルなモデルについては、まあ、そこまではならへんやろうって考えた方がええと思います。ただ、OpenAIやしAIの世界やから、何らかのブレークスルーがあって、これが可能になる可能性もあることは理解せなあかんと思います。
OpenAIはSoraみたいなもので、そしてもちろんGPT-4のリリースでも私たちを驚かせてきました。当時は信じられへんくらい賢かったですし、高度な音声モードもかなり信じられへんものでした。
問題のモデル、Orionという名前は様々な場所で出回ってきてて、約1ヶ月前にThe Informationが報じたものです。The Informationはテック業界の発展に関する信頼できるニュースソースです。
彼らは「OpenAIが連邦政府にストロベリーAIを見せ、それを使ってOrionを開発している」という記事を出しました。これはかなり驚くべき記事でした。というのも、ストロベリーについては、様々な推測と、結果的にはかなり正確やった理論をまとめようとして研究論文を掘り下げてた人々以外には、実際の詳細は分かってへんかったからです。
この記事は実際にOrionのいくつかの詳細について触れてて、ストロベリーの最も重要な用途の一つは、現在開発中のOpenAIの次の大型主力モデルであるOrionの高品質な訓練データを生成することやと書いてあります。このコードネームは以前には報告されてへんかったそうです。
誰かが「なんでGoogle、Amazon、OpenAIがギリシャ神話をモデルの名前に使うてるんか説明できる人おる?例えばGeminiとか」って聞いてはりました(すみません、Amazonの名前は忘れました)。
これは完全に理解できます。おそらく、01が完全版でリリースされてへんのは、実際にはOrionモデルの訓練に使われてきたからで、このモデルが完全に完成して、もう何もする必要がなくなった時に、01を私たちにリリースするんやないかと。
次のモデルは、おそらく安全性テストの段階にあるんでしょう。ここで見えてくるのは、ストロベリーを使ってOrionを支援することを決めた理由です。ストロベリーは01プレビューと同じもんですけど、研究者らが言うように、幻覚や誤りの数を減らすのに役立つからです。
AIモデルは訓練データから学習するので、複雑な推論の正しい例をより多く見れば見るほど、より良くなるわけです。
先ほど言うたように、The Informationが非常に信頼できるソースやという理由は、当時OpenAI内で、蒸留というプロセスを通じてストロベリーを簡素化して小さくすることが進められていたという話をしてはったことです。
これは、チャットベースの製品として使えるようにするためで、実際に彼らはそうして、今日私たちが持ってるモデルがそれです。これはもちろん、顧客獲得競争が激化してて、最高の製品を持ってる者が勝つという状況があるからです。
Orionという名前が単なる推測やと思う人もおるかもしれませんが、サム・アルトマンは実際にこれについてツイートしてて、このツイートをChatGPTに入れて何を指してるか聞くと、これはおそらくOrionを指してるって言います。
面白いのは、AIの予測については信じられへんくらい当たる人、最近のAnthropicのリリースも予測した伝説のJimmy Applesが「10月に戻って、10月には4倍のモデル、おそらく4.5って呼ばれるものが出るはず」って言うてることです。今月はあと7日ほどしか残ってへんのですけど。
そして彼は「ビッグボーイのGPT-5は、早ければ12月って聞いてるけど、みんなの精神衛生のために、2024年第1四半期から第2四半期って考えておいた方がええかも」って言うてます。
私の理論なんですけど、これらのモデルが10月か12月に予定されてたかもしれませんが、OpenAIが競合を見て、現時点で01プレビューが利用可能な他のどのモデルも上回ってて、多くの推論カテゴリーで最先端やから、誰かがこれらのモデルを使いたい時は、01プレビューかGPT-4を使えば大きな問題なく対応できると考えたんやないかと思います。
そのため、OpenAIはあまりプレッシャーを感じてへんと思います。ただ、Googleのジェミニ2に関しては、パフォーマンスと推論能力の面で大きな期待があるので、私個人としては、他の企業が追いついてくるまで、OpenAIは新しいモデルをリリースせんのやないかと思います。
もちろん、完全に間違うてるかもしれませんが、最近GPTsとキャンバス、そして01プレビューも手に入れたことを考えると、OpenAIはあまりプレッシャーを感じてへんと思います。OpenAIが最後に大きなプレッシャーを感じたのは、Claude 3.5 Sonnetが突然現れて、コーディング能力の面でGPT-4を圧倒した時やったと思います。
そう考えると、この記事のどの部分がフェイクニュースやと思いますか?企業が自社製品を開発するために最初にアクセスを許可されるという部分は、完全に嘘やとは思えません。今思い出したんですけど、OpenAIのページのストーリーページに行くと、OpenAIと様々な製品で協力してきた企業が全部載ってるはずです。最初にこれを思い出せんかったことは申し訳ないんですけど、私のいる場所はもうかなり遅い時間なんです。
もしGPT-4の100倍パワフルなモデルが本当やとしたら、それは絶対に信じられへんことで、AIに対する私たちの期待の新しい時代を開くことになると思います。おそらくAGIへの期待も時期が早まることになるでしょう。
これが一番驚くべきことやと思いますが、OrionがストロベリーのAI生成データで訓練されてるという部分はかなり真実味があるし、次の2ヶ月以内に少なくとも1つの新しいOpenAIモデルが出てくる可能性は高いと思います。Jimmy Applesによると、2025年第2四半期まで遅れる可能性もあるそうです。
そういうわけで、サム・アルトマンのツイート「フェイクニュースが制御不能になってる」を最後に残して、何が起こってると思うか、コメント欄で教えてください。