見出し画像

新時代のAIモデル『Grok-3』を試してみた——OpenAIを脅かす新たなライバル

ついに「Grok-3」が手元で使えるようになったので、さっそく試してみました。無料枠でもある程度利用できるとのことなので、気になる方はぜひ体験してみてください(基本的には有料プラン)。

率直な感想としては、「OpenAIのライバル」として十分に機能し得るAIだと感じました。一部では、Claude 3.5 Sonnet(Anthropic)やGPT-4o(OpenAI)を超えているという話もありますが、それが嘘ではないと実感できる場面もありました。

とはいえ、Anthropicも新しい推論モデルのリリースが噂されていますし、OpenAIもGPT-4.5の公開を控えています。今後ますますAI競争が激化しそうで、非常に楽しみですね。


1. 使用感

🌐https://x.com/i/grok

こちらのリンクからアクセスすると、Grokのページに飛べます。もちろん、X(旧Twitter)のサイドバーからでも移動可能です。

モデルの性能は「DeepSearch」と「Think」で切り替えができ、それぞれの特徴は以下のとおりです。

1.1 DeepSearch

OpenAIの「Deep Research」に近い挙動を示します。調査過程がわかりやすく表示されるため、検討、調査プロセスを把握したい場合には非常に便利です。
以下に使用例を示します。

調査過程が凄く見やすい。

OpenAIの「Deep Research」の結果も参考までに共有します

余談ですが、調査過程を覗くのは見ていてけっこう面白いですね。

1.2 Think

OpenAIの「o-series」に近い挙動をします。こちらも使用例を示します。

フェアな比較ではないですが、参考までにOpenAIのo1 proの結果も共有します。

詩的で凄く好き。

1.3 DeepSearchかThinkか、それが問題だ

Grok自身は以下のように、タスクに応じて使い分けるのがよいとしています。

2. Grok-3

特に「DeepSearch」や「Think」を選択しなくても、Grok-3はかなり高性能だと感じます。実際にいくつかの問題や質問を投げてみました。

2.1 strawberry問題

おなじみ、strawberry問題
→🌐たぬの過去記事

2.2 この人は誰?

これが——イーロン・マスク……。

We're seeing some heavy traffic, so we've opted for an alternate model to get your answer to you faster.とあるように、古いモデルが使用されたかもしれませんね。(わりと、情報がない人物だととりあえず「イーロン・マスク」って答える癖があるような🙄)

2.3 プログラミング:ブロック崩し

ブロック崩しの簡単なサンプルコードを1回のやり取りだけで生成してくれました。もちろん、この程度のゲームであれば、ほかのAIでも十分に作れますが、素早さやレスポンスの明瞭さは目を見張ります。X上ではさらに高度なゲームを作っている方も見かけました。

3. 価格

執筆時点では、価格についてやや情報が錯綜していますが、参考までに以下のようになっています。

X Premium+:月額6,080円

やや高めの印象はありますが、ChatGPT Pro(約200ドル+税)よりは安く感じる面もあります。まずは無料枠で試してみて、自分の用途に合うかどうか検討してみると良いでしょう。

4. まとめ

Grok-3は日常的に使う分にはまったく不自由を感じない、高い精度と応答速度を両立したAIです。今後ユーザー数が増えれば負荷状況によって変動はあるかもしれませんが、少なくとも執筆時点ではストレスなく利用できました。AnthropicやOpenAIの新モデルが続々と登場してくるなか、Grok-3もまた有力な選択肢として注目に値する存在だと感じました。

余談

やたら品質の良いイーロンマスクのコラ画像製造機ではない😎

いいなと思ったら応援しよう!