見出し画像

O3: OpenAIによってAGIへの第一歩が踏み出された!

6,162 文字

12日間の最後を締めくくるにあたって、カレンダーの最終発表、第12の発表が行われました。12日前に私たちはAIが通常モードで利用可能になったというニュースから始まりました。それまでミニとプレビューしかありませんでしたが、12日後の今日、12の発表を経て2週間後に、最後の発表としてO3がリリースされるという報告がありました。
私たち一般ユーザーは、One の能力を十分に活用するのに苦労していました。複雑な思考、コードの作成、数学や物理の研究、自己反復的なコードなど、普段やらないようなことばかりでした。今回彼らは、O3がOneを圧倒的に上回るベンチマークを示しました。O3でゲームは完全に変わりました。このモデルは非常に効率的で、強力かつ高速に動作し、コーディング、科学研究、数学において卓越した能力を発揮します。
参考までに、今週初めにサム・アルトマンは、One以降のモデルがAGI(人工知能一般)の基盤となると述べていました。彼の説明によると、AGIとは、AIがソフトウェアに対して行動を起こし、特定の環境で一定の自由度を持つ能力のことですが、これはGPTタイプのモデルでは実現不可能で、Eタイプのモデルで実現するだろうと説明しました。
もちろん彼は、本日12月20日金曜日にO3を発表することを事前に知っていたはずです。私はこれについて、AGIの最初の段階に到達したと考えています。形而上学的・哲学的な意味での「私たちの生活を支配するコンピュータの神」という意味ではなく、純粋にベンチマーク的な意味で、地球上のどんな知的な人間よりも高い能力を持つという意味です。知的な思考能力と行動力が人間を超えるところまで来ているということです。
O3は私たち一般ユーザーには利用できず、研究者のみが申請フォームを提出して利用できます。彼らはO3ミニをテストする権利を得ることになります。O3は2つのサイズ、ミニと通常版でリリースされ、通常版はミニよりもはるかに強力です。ミニ自体も3つのパワーレベルを持ち、Oneよりもはるかに強力です。
O3は3つの能力レベル(低・中・高)があり、それぞれ速度と消費リソースが異なります。すべてAPIの形で利用可能になるため、地球上のあらゆるプログラムに組み込むことができます。O3ミニはOneよりも安価になるでしょう。現在GPTプラスの通常サブスクリプションは20ユーロ、One Proは200ユーロですが、One plusとO3 plusを含む2000ユーロのプランが登場してもおかしくありません。まあ、それは今後わかることです。
研究者たちは現在テストを行っており、O3ミニは1月末にリリースされる予定です。ただし、日付は研究者たちのテスト結果次第で変更される可能性があります。O3は、O3ミニの後にすぐにリリースされる予定です。
彼はまた、人工知能一般(AGI)についても簡単な説明を行い、私の知らない人物であるArcの創設者を会議に招きました。Arcは明らかにAI向けのIQテストのようなベンチマークを提供している組織です。これまで、GPTスタイルの従来のLLM(大規模言語モデル)は、テキスト生成を行うタイプのAIで、認知能力、思考能力、学習能力は数学的な意味でゼロに近いスコアでした。
彼らはこのようなIQテストを準備し、AIの異なる種類の知能をテストしました。複雑な問題を小さな問題に分解できるか、小さな問題を反復的に処理できるか、解決策を考えながら「これを試してみよう、いや、これはうまくいかない、では次はこれを試してみよう」というように、短期的な学習能力を持って問題解決を進められるかなどをテストしました。
Arcの創設者は、0から85までのベンチマークを構築したと説明しました。0は「石ころレベル」で、85は「人間レベル」を意味します。つまり、十分な思考能力があり、必要な努力をすれば、例えば赤ちゃんのように「この姿勢だと痛いから、3回はやるけど4回目はやらない」といった学習能力、思考能力、より複雑な問題解決能力を持っているということです。
85は平均的な人間のレベルを指します。そのレベルであれば、人生を送り、多くのことを学び、問題を解決することができます。Oneのベンチマークは31から34程度で、これも非常に印象的な数値でした。そしてO3をテストしたところ、ベンチマークで87程度のレベルを示したとのことです。つまり、人間を超えるレベルということです。
AGIの一部の概念において、まだリリースされていないO3は、ミニバージョンでのテスト段階ですが、ベンチマークの創設者は来年OpenAIとパートナーを組んで、87を超えるレベルを測定できる新しいベンチマークを作成すると述べています。つまり、人間の知能をはるかに超えるレベルを目指しているということです。
これは慎重に受け止める必要がありますが、彼の説明によると、O3は人間よりも「知的」になるということです。ここでいう「知的」とはカギ括弧付きで、テストされた様々な種類の知能という意味です。これが今回伝えられたメッセージです。
O3は驚異的なものとなり、人間よりも知的になり、数ヶ月後には誰もが利用できるようになります。現在は研究者のみがテストを行っており、申請フォームを提出して承認を受ける必要があります。O3ミニは1月末にリリースされ、O3はその直後にリリースされる予定です。
サム・アルトマンは、これらすべてに対して冷静で落ち着いた態度を示しています。今週誰も見ていなかった開発者会議で彼が言ったように、彼らは直接AGIを目指しており、非常に満足しています。彼らは最初になり、リーダーとなり、永遠に最高のAGIを提供し続けるということです。
2週間前には、このようなものが出てくるとは思っていませんでした。2時間前も同様でしたが、今や私たちはそこに到達しています。私は個人的にO3をテストする能力が全くないと感じています。化学成分の問題や新材料の発明でもない限り、O3に何を求めていいのかわかりません。
しかし、これは非常に印象的です。これは科学研究者、数学者、プログラマー向けのものです。彼らが示した例は驚くべきものでした。私はコードの例しか理解できませんでしたが、基本的に「ウィンドウを作成し、それ自体がO3を呼び出し、自身の能力をテストし、同時にコンソールに記録を残す」というような複雑なプロンプトを要求すると、20秒ほどで完全に機能するプログラムを作成しました。彼らは2つのバージョンを実行していたようです。少し不気味なほどです。
このアドベントカレンダーの最後のチョコレートは、大きな話題を呼ぶと思います。一般のメディアはこのような内容を理解できないので、一般大衆の間では話題にならないでしょう。政治家の間で話題になってほしいところですが、それも望めません。哲学者たちもO3を理解する前にGPTについて理解する必要があります。
しかし、ここでは人工知能一般について、全く新しい世界的な段階に入っています。これはSFや映画「ターミネーター」的な哲学的な意味ではなく、平均的な人間や博士課程の学生よりもはるかに速く、より強力に考え、人類がこれまで解決できなかった科学的な問題を解決できるという意味でのAGIです。
私は日常的に人類が解決できていない問題を扱うことはありませんので、この話が私に関係するのかどうかわかりません。しかし、このような存在と同じ惑星に住む人間として、私たちは少なくとも関心を持つ必要があるでしょう。
そうそう、アラインメントについても大きな取り組みがあります。会議の最後に競合他社について言及がありました。AnthropicのClaudeとGoogleのGeminiについて、エラーとアラインメントに関するベンチマークを示すダイアグラムで直接比較しました。One(O3ではなくOne)の2つのモデル、Anthropicの2つのモデル、Geminiの2つのモデルについてです。
今日、思考能力、問題の分解、問題解決能力を持つのはAnthropicとGemini、そしてOneとO3だけです。彼らは3社を比較し、適切にアラインメントされているか、つまり世界を支配して我々を裏切るような能力を持っていないかを検討しました。これは大きな誇張ですが、私たちは以前のライブやRenoDecodeでアラインメントについて話し合いました。これは本当に重要な課題です。
彼らはO3には自己保証、自己制御、自己検証が組み込まれると説明しました。つまり、O3が不適切なものを生成したり、制御を離れようとしたり、人間に害を与えようとしないことを確認するということです。これについては世界的な法律は全くありません。
O3は監視されて、アラインメントの欠陥がないようにされます。しかし面白いことに、O3を監視して、アラインメントがずれていないか、不適切な応答をしようとしていないかをチェックするのは、O3自身です。O3が応答を提供する際、別のO3がその応答をチェックし、アラインメントされているかどうかをテストします。アラインメントされていないと判断した場合、応答は途中で切断され、続きは得られません。
つまり、一種のスイッチがあり、O3のスイッチを制御しているのはO3自身だということです。少なくとも私はそのように理解しました。皆さんも同じように理解されたでしょうか。
彼らは自分たちがリーダーであることを示すため、GeminiとClaude、そしてO3ではなくOneのモデルを比較したダイアグラムを示しました。O3はダイアグラムに含まれていませんでした。彼らはOneが競合他社よりもアラインメントエラーが少なく、アラインメントの問題で中断されることが少ないと説明しました。これは完璧だということではなく、他のモデルよりも問題が少ないということです。
これはOneについての話で、O3はダイアグラムに含まれていませんでした。なぜなら、彼らはまだそれについてのフィードバックを持っていないからです。そのため、1月中に研究者たちにテストしてもらい、O3が生成する可能性のある問題やアラインメントの問題を確認すると説明しました。
システムが制御を離れようとしないか、O3によって適切に制御されるか、問題を起こした際にO3が「いや、それは問題だ」と制止できるか、つまり十分に安全かどうかを確認します。これは個人データがFacebookに流出するようなデータセキュリティの問題ではなく、アラインメントという意味での安全性です。
大きな問題を起こす可能性、例えば地球上のすべての人間を確実に殺すことができる病原体の化学式を発明して公開するようなことができないかどうかです。少し怖がらせるような話になりますが、アラインメントについて話し、中期的に考える際には、このような問題が議論されます。
本日12月20日、AGIへの第一歩が踏み出されました。「ルノー、この発表について、将来の雇用、安全性、政治などについてどう感じていますか?」
ありがとう、ジェナヌス、とても賢明な質問です。私は少し距離を置いて考えています。なぜなら、私は社会的リスク、人類にとっての悲劇のリスク、社会の分裂のリスク、国家の崩壊のリスク、大量失業のリスク、国家間の混乱、生態学的な混乱、世界的な混乱、地政学的・地政戦略的な混乱、これらすべてのリスクは人間に起因すると考えているからです。
少し話が大きくなっていきますが、質問に答えようと思います。これらの人類的な災害が起こり得ると確信していますが、それは人間から発生すると確信しています。
フランスの人口の20%が職を失うことを考えてみてください。これは現在GPT4で既に起こっている事態で、誰も気にしていません。特定の職業が消滅しつつあります。フランスの人口の10〜20%、他の国ではもっと深刻かもしれませんが、今後数年のうちに仕事を失い、40歳で立ち直る術がない状況に陥ります。
40歳で学校に戻ることはできません。退職はまだ先で、年齢制限は延長されています。ベーシックインカムについては論じる必要もありません。退職について考える必要性についてすら合意できない状況です。私たちの政治家たちをご覧になったでしょうか。
私にとって、問題はそこから発生します。私たちは再教育を受けられず、今後20年で仕事を失うことになります。フランス人の相当数が仕事を失い、他の職種に転向しなければならないのに、それができないのです。悲劇が起こり、家族が崩壊し、生活水準が激変する人々が出てきます。
失業保険制度は機能しなくなり、退職制度も機能しなくなり、雇用保険制度も機能しなくなり、医療制度も機能しなくなります。これは大変な悲劇です。これは高度に文明化され、非戦闘的で完全に民主的なフランスという一国の規模での話です。フランスではこの混乱はまだ始まったばかりだと思います。
これが私を怖がらせるものです。これこそが私を不安にさせます。一方で、人間よりも知的な人工知能一般であるO3が、非常に知的な研究者たちによって使用され、新しい材料を発見し、これまで解決できなかった数学的・宇宙物理学的問題を解決し、エネルギーや生態学的な解決策を見つける可能性があるということについては、私は心配していません。
それは私を怖がらせません。私はそれを世界の続き、世界的な冒険の続き、地球上の人類の続きとして見ています。それがどこに向かうのかはわかりませんが、私は明らかに観客として見守ることになるでしょう。
これが私のO3に対する感じ方です。火星やその他の場所に向かうロケットの打ち上げを見るように、歴史が作られていく様子を見守る観客のような気持ちです。それは私の理解を超え、私の手に負えません。ただ、このような規模のイノベーションと進歩が、人類に良い方向で恩恵をもたらすことを願うばかりです。
このような進歩が科学者、研究者、地球上の最高の知識人たちの手にあり、彼らがコミュニティとして働いている場合、悪い方向に進む可能性は低いと考えたいと思います。しかし、政治家たちがこれに手を出したり、全体主義的な国家であろうとなかろうと、国家がこれに手を出したりすれば、そこには恐れるべき理由があります。
例えば、アメリカで少し変わった選挙が行われ、少し変わった人物が選ばれ、その人物が地球上で最も力を持つ産業家、おそらく世界最大の産業家と同盟を結び、彼らが世界社会の特定の側面について少し極端な考えを持っていて、この二人が最も重要で、最も武装し、最も軍事力のある国の政府のトップに立つような状況になれば、それは恐ろしいことです。
問題は常に人間にあると私は考えています。O3や、O3と協力して働く人間の科学者たちについては、それほど恐れていません。
以上が私の考えです。金曜日としては少し形而上学的な話になりましたね。では皆さん、お疲れ様でした。素晴らしい金曜の夜をお過ごしください。また会いましょう、さようなら。

いいなと思ったら応援しよう!