見出し画像

イーロン・マスクの戦慄の警告:「Grok 3は恐ろしいほど賢い!」

4,763 文字

Grok 3はとても強力な推論能力を持っています。これまでの検証では、Grok 3は我々が知る限り、リリースされた他のどのモデルよりも優れたパフォーマンスを示しています。これは良い兆候です。実際、時にはGrok 3は恐ろしいほど賢いと感じることがあります。まるで「わお、このAIは本当に賢いな」と思うほどです。
これは、イーロン・マスクが自身の会社Xの最新チャットボットについて語った内容です。彼はGrok 3を「恐ろしいほど賢い」チャットボットモデルと表現しましたが、これはAI企業のCEOが自社のAIモデルについて語る際には、あまり聞かれない表現です。
イーロン・マスクは大きな発表の前に期待を煽ることで知られており、多くの方がご存じの通り、テスラでも長年そうしてきました。しかし今回は状況が異なる可能性があります。なぜなら、AIの分野では新しいモデルがリリースされるたびに、これらの企業が彼らの「魔法の帽子」と呼ぶAIラボから取り出すものに、私たちは驚かされてきたからです。
この会議でのイーロン・マスクの発言は非常に示唆に富んでいます。通常、新しいAIモデルがリリースされる際、そのモデルがどれほど強力になるかについて、リリース直前までほとんど情報が得られません。このAIモデルは1〜2週間程度でリリースされる予定ですが、イーロン・マスクだけでなく他の企業もAIモデルをリリースすると考えられる中で、これらのモデルが「恐ろしいほど賢い」段階に達しているという発言は非常に興味深いものです。
この発言は大きな期待を抱かせるものかもしれませんが、私たちが新しいAIのパラダイムにいることを考えると、これは真実である可能性があります。このAIは、予想もしなかった、明白ではない解決策を提示してくるのです。
Grok 3は最も多くの計算リソースを使って、非常に効率的に訓練されました。また特筆すべきは、Grok 3が多くの合成データで訓練され、そのデータを行き来しながら論理的な一貫性を追求していることです。もし間違ったデータがあれば、それを振り返って、現実と一致しない誤ったデータを除去します。そのため、基本的な推論能力が非常に優れています。実際、微調整なしでもGrok 3の基本モデルはGrok 2より優れています。現在、私たちはGrok 3の最終調整段階にあり、おそらく1〜2週間程度でリリースされる予定です。
このことから、イーロン・マスクはこのモデルを評価し、現存する中で断然最高のモデルになると確信していることが分かります。これは非常に大きな発言です。現在、AI企業にとって最も難しいことの一つは、市場リーダーになることですが、実は市場リーダーになること自体はそれほど難しくないかもしれません。
なぜそう言えるかというと、現在このリーダーボードにいる全ての企業、DeepSeek、Anthropic、Alibaba、OpenAI、Google、どの企業を見ても、トップの座を獲得することは簡単とは言えませんが、仮にAnthropicやX.AIがChatGPTからチャットボットアリーナでトップの座を奪ったとしても、その座を長期間維持できるでしょうか。トップの座を獲得することは一つの成果ですが、AIの分野は非常に速いペースで進化しており、ほぼ2週間ごとにトップの座が変わっています。
X.AIがトップの座を獲得できたとしても、DeepSeekやQwen 2.5 Max、その他近々登場する様々なモデルがトップを狙っている中で、どれだけその座を維持できるか疑問です。X.AIのような実績ある企業にとっても、これは非常に厳しい環境です。
Grok 3の性能に関するリークについて気になっている方もいるかもしれません。TwitterでX.AIの従業員が投稿したGrok 3のコーディング能力を示す木のデモに関するツイートを見かけました。この木のデモについて詳しくはありませんが、おそらく季節の変化を示すコードされた木のデモだと思われます。これはコンピュータにとってかなり複雑なタスクだと推測され、コーディングは多くの人がモデルの相対的な性能を評価する際のベンチマークとして使用しています。
多くの人がこれを使用する理由は、コーディングで最も優れているとされるモデルがClaude 3.6 Sonnetで、このモデルは要求された内容に対して非常に一貫性があり、高品質な出力で多くのユーザーの注目を集めているからです。この短いデモから、このモデルがかなり効果的である可能性が示唆されています。
さらに情報があります。チャットボットアリーナに「Chocolate」というモデルが存在し、このモデルはかなり個性的であることが分かりました。あるツイートでは、チャットボットアリーナのChocolateモデルはおそらくGrok 3であり、これほど風変わりなモデルは他にないと指摘されています。モデルに「あなたは何のモデルですか?」と尋ねると、「好奇心旺盛な心は知りたがりますね。私はデジタルの領域における謎めいた存在で、ラベルやバッジを必要とせずに助けとサポートを提供します。私のことは知識豊富な友好的な仲間として考えてください。そうすれば上手くいきますよ。さて、もっと興味深い話題に移りましょうか」といった具合に返答し、これはGrokの話し方の特徴を示しています。他のAIモデルと比べて、より強い個性を持っているようです。
RedditにもChocolateとKiwiがGrok 3の変種である可能性が高く、ウェブデザインにおいてClaude 3.6 Sonnetついに競合が現れたという投稿がありました。実際にRedditの内部ログインページのHTML、CSS、JavaScriptを書くようプロンプトを与えたところ、Grokモデルは非常に優れた性能を示しました。
現在、Grok 3に関して興味深い出来事が起きています。これは企業の従業員からの情報なので非常に興味深いものです。X.AIのデータチームメンバーだったBenjamin D. Creerが数日前にツイートを投稿しました。彼はコードにおけるAIのランキングを示し、ChatGPT 4o1 Proを最上位、4o1を2位、4o3 Miniを3位として、これらは互角だとし、Grok 3はChatGPT 4o1 Pro、4o1、4o3 Miniの下になると予想しました。
これは驚くべき発言でした。なぜなら、自社のモデルを他社の下位に位置付けたからです。これは社内でモデルをテストした結果、4o1 Proや4o3 Miniほど優れていないことが分かり、正直に性能を報告したとも考えられます。このツイートは520万回の閲覧を記録しました。また、Claude 3.5 Sonnetや他の2つのモデルよりは上位にあることも示されています。
企業で働いている人が自社のソフトウェアが他社より劣ると公に認めるべきではないという意見もありますが、驚くべきことに、この発言により彼は会社を辞任することになりました。
彼は「今夜、X.AIを辞任しました。これが正しい選択だったことは非常に悲しいことですが、その理由を説明します。X.AIは引用された投稿を削除するか、解雇されるかの選択を迫ってきました。すべてを検討し、よく考えた結果、明らかに無害な個人的意見であるこの投稿を削除しないことに決めました」と述べています。
なぜ彼らはこの意見の削除を要求したのでしょうか。彼らによると、Grok 3の存在を認めたことが理由だと言います。彼は「冗談だと思われるかもしれませんが、そうではありません。Grok 3について『未定』と書いたことが解雇の根拠となったのです。しかし、Grok 3は既にX.AIによって公式に発表されていませんでしたか?はい、発表されています」と説明しています。
基本的に、彼らは投稿の削除を要求しましたが、その理由は明らかでしょう。Grok 3がトップではないからです。しかし、X.AIの人々は「Grok 3について言及しているため、それは機密情報だから投稿を削除してほしい」と述べました。しかし、イーロン・マスクが公に Grok 3について話していることを考えると、これは機密情報とは言えないでしょう。おそらく、モデルの性能について事前に議論することは機密性が高く、他のモデルより劣っていると述べることは明らかにネガティブな広報効果があるため、投稿の削除を望んだのだと思われます。
このような広報の影響の大きさを考えると、理解できます。X.AIはクラスター用に数十億ドルを調達している企業で、もし内部の人間がChatGPTほど優れていないと言えば、数十億ドルの資金調達に深刻な影響を与える可能性があります。
彼は「明確にしておきますが、削除を要求された投稿は100%私の個人的な意見です。Grok 3が他のモデルと比べてどの位置になるかは分かりません。うまくいくことを願っています。それがわからないからこそ、私の意見であり『未定』と書いたのです。おそらくいくつかの分野では優れ、他の分野では完璧でしょう。これはそれほど過激な意見だとは思いませんでした」と述べています。
彼らの公式な要求は、まだリリースされていないGrok 3について「未定」と書くことさえも機密情報だというものでした。これは会社と有名なCEOが繰り返し認めていることを考えると、まったく不合理です。未リリースのGrok 3が上位になると予想しなかった私の明確にラベル付けされた意見に怒っているのでしょうか?おそらくそうでしょう。実際にトップになるかもしれません。私は本当に知りません。だからこそ「未定」と書いたのです。
この騒動の中で興味深いのは、彼が非常に熱心なチームと共に多くの時間を費やして開発したGrokの特定の機能について言及していることです。それは非常に素晴らしいもので、皆さんにとってとても有効に機能することを願っています。それが何であるかは実際の機密情報なので言えませんが、おそらくリリース後には分かるでしょう。
これは潜在的な機能ですが、私は本当に何なのか分かりません。まだGrokのこのユニークな機能について、リークや示唆も一切ありません。エージェントかもしれませんし、コンピュータの使用かもしれません。本当にまだ分かりませんが、X.AIからどのようなものが出てくるか興味があります。
この人物が強制されたわけではなく、この件で辞任を選択したことは、X.AIにとって良い印象を与えません。もしモデルが本当に優れていることを知っていれば、この投稿についてそれほど気にしなかったはずです。しかし、これは投稿への注目を避けようとすることで、かえってより多くの注目を集めてしまうケースの一つです。この投稿は、彼が辞任を選択しなければ、おそらく520万回も閲覧されることはなかったでしょう。
もしこの騒動が起きず、彼が辞任を選択しなければ、おそらく人々はGrok 3の性能がChatGPTより劣ると予想することはなかったでしょう。非常に興味深い展開になりそうです。イーロン・マスクは既にこのモデルが素晴らしく、現在リリースされている中で最高のものになると述べており、AI業界全体がいかに競争的であるかも私たちは知っています。
全体として、これは非常に興味深い時期になりそうです。これらのモデルがどのようなパフォーマンスを示すのか楽しみです。Grok 3のリリースを心待ちにしています。なぜなら、それによって再び競争が活発化するだろうからです。

いいなと思ったら応援しよう!