見出し画像

Grok 3の実力は?最新AIの"Vibe Check"

 みなさん、こんにちは!ついに来ましたね。イーロン・マスク率いるxAIが新作AI「Grok 3」を発表しました。

 OpenAIの創業者として知られるAndrej Karpathy氏が、Xで興味深い分析を投稿していて、大きな話題を呼んでいます。今日は彼の投稿から、Grok 3の実力について詳しく見ていきましょう。

 Karpathy氏によると、前のバージョンと比べて10倍もの計算パワーを投入したとのこと。これは注目に値する進化かもしれません。

なにがすごいの?

 Karpathy氏が最も評価しているのは「考える力」だそうです。例えば、「カタン風のボードゲームを作って」という指示に対して、しっかりとしたコードを書けるとのこと。まるで、数学の問題をじっくり考えて解く優等生のような振る舞いを見せるようです。

 知識と計算力の組み合わせも注目ポイントとして挙げられています。「GPT-2を作るのに必要な計算力は?」といった複雑な質問にも答えられるそうです。これは、他のAIにはない特徴だと指摘されています。

 特筆すべきは「チャレンジ精神」とのこと。例えば、未解決数学問題の「リーマン予想」に対して、他のAIが「無理です」と諦めるところを、Grok 3は「やってみよう!」と挑戦する姿勢を見せるそうです。

新機能の評価

 Karpathy氏の投稿によると、Deep Search機能も注目に値するようです。最新ニュースを集めて要約してくれる機能で、「Appleの新製品の噂」といった質問に対して、ネットの情報を集約して回答できるとのこと。

 画像の理解力も向上したと報告されています。写真を見せて質問すると、内容を理解して適切に応答できるようになったそうです。

課題も指摘

 一方で、Karpathy氏は課題も指摘しています。ジョークの質については改善の余地があるようです。「なぜニワトリはバンドに入った?」("Why did the chicken join the band? Because it had drumsticks!")といった古典的なダジャレのレベルにとどまっているとのこと。英語の"drumsticks"が「ドラムスティック」と「チキンの手羽」の両方の意味を持つことを利用した古典的なジョークですが、このように平凡なユーモアしか提供できないようです。

 倫理的な質問に対しては過度に慎重な姿勢を見せるという指摘もあります。簡単な思考実験でも「それは議論できません」と回避する傾向があるそうです。

新プラン「SuperGrok」の詳細

 発表によると、月額30ドル(年間300ドル)で、Grok 3の最新機能が制限なく利用可能な「SuperGrok」というプランもあります。Deep Search機能や画像生成機能が完全解放されるそうです。

 なお、Xの Premium+(月額2590円)でも利用可能ですが、一部機能は SuperGrokプラン限定とされています。

Karpathy氏の総評

 Karpathy氏の分析では、Grok 3は特に「考える力」において高い評価を得ています。他のAIモデルが回避するような課題にも積極的に取り組む姿勢が、特徴として挙げられています。

 完成度の面ではまだ改善の余地があるものの、AI技術の新たな可能性を示す存在として注目されているようです。

 今後のアップデートで、これらの課題がどのように改善されていくのか、引き続き注目していく価値がありそうです。ChatGPTのProプランは月額3万円と高額なので、o1-proと同等か、それ以上の成果を示す場面もあったSuperGrokにお金を使うという選択肢もありかもしれません。にしても,SuperGrokはどうやって申し込めばいいんですかねw

いいなと思ったら応援しよう!