見出し画像

Grok3の使い方とレビュー

 [読了目安: 3分]

NO AI(人間が書きました✍️)

AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事ではXから新しくリリースされたGrok3の使い方とレビューについて解説します。

Grok3の概要

イーロンマスクが設立したxAIというAI企業が開発したAIモデル。以前まではGrok2のモデルでしたが2月19日にGrok3がリリースされました。
イーロンマスク曰く「地球上でもっとも賢いAI」だそうです。
AIモデルの比較ランキングができるチャットボットアリーナでも2025年2月20日時点で1位にランクインしています。

Grok3の始め方

公開初日は月額980円のXプレミアム以上のユーザーである必要がありました。
ですが、翌日に無料ユーザーも使えるようになりました。

X上から、もしくはGrokのサイトから利用できます。

Grok3を試す

操作方法についてChatGPTと同じような画面なので迷う人は少ないと思います。チャットボックスに指示を入力して実行を押すだけです。

まず試しにいつものすももテスト行ってみましょうか。

「すもももももももものうち」の中に"も"はいくつ含まれていますか?

Grok3、回答できず…!
次にThinkモードに切り替えて実行してみます。チャットボックス下側のボタンを押すことで使用できます。AIが推論を重ねて回答を導き出してくれます。

こちらでは成功しました。

文章校正

次に日本語の文章校正タスクを実行してみます。
文章校正のタスクは現状、ChatGPTが強い印象ですがGrokはどうでしょうか?

###指示###
ユーザーが添付した日本語の文章を校正する。{テキスト}が添付されたら丁寧に、ゆっくり確実に実行する。校正したテキスト全体をアウトプットする。
条件1: もし修正箇所がなければアウトプットしたテキストの先頭に「修正はありませんでした」と出力する。
条件2: もし修正箇所があれば「修正しました」と出力する。

###ルール###
- 誤字脱字を発見、訂正する
- 漢字の間違いを発見、訂正する
- 絵文字や記号は誤字脱字と認定しない

###注意###
- 敬語や言い回しの修正は行わない
- 先頭のテキストは「修正はありませんでした」「修正しました」以外の言葉は追加しない
- 校正後のテキストをアウトプットする際はMarkdown形式で出力せずテキストとしてそのまま出力する。ただし、元の文の改行やスペースはそのままにする。

"""テキスト:
生成AI(Generative AI)とは、人口知能(AI)の一分野であり、データから新しいコンテンツを生成suる能力を持つモデルやアルゴズムを指します。生成AIはテキスト、画像、音楽、動画など、さまざまな形式のコンテンツを生成することができ、その応用範囲は非常に広いです。
生成AIの代表的な技術には、生成的敵対ネットワーク(GAN)や変分オートエンコーダ(VAE)、トランスフォーマーモデヌ(GPT-4など)が含まれます。GANは二つのニューラルネットワーク、生成器と識別器が互いに競い合うことで、リアルなデータを生成します。VAEはデータの洗剤的な構造を学習し、新しいデータポインを生成するために使用されます。トランスフォーマーモデルは主に自然言語処理(NLP)に用いられ、大量のテキストデータを学習して新しい文章を生成します。
生成AIはクリエイティブな分野での応用が注目されており、アート、音楽、文学などで新しい作品を生み出すことが可能です。例えば、AIが作曲した音楽や、AIが描いた絵画は既に多くの人々の興味を引きつけています。また、生成AIはマーケティング、広告、げーむ開発などのビジネス陵域でも利用されています。例えば、カスタマイズされた広告キャペーンの生成や、ゲーム内キャラクタの自動生成などです。
"""

おぉ…全部修正してくれる。

ファイルアップロード

Grok3ではファイルアップロードも可能です。
クリップアイコンをクリック→ファイル選択→アップロードの流れです。
少しややこしいのが音声(mp3)や動画(mp4)も選択可能ですが、アップロードするとエラーが発生します。現時点ではメディアファイルは対応していないようです。
一方で画像やPDFは対応しています。
先ほどのチャットボットアリーナのスクリーンショットを読み込ませて文字起こししてみました。

Rank*   Rank    Model                           Arena   95%     Votes   Organizati License
(UB)    (styleLctr1)                          Score   CI      on

1       1       _chocolate...(Early_Grok-3).    1462    +7/-6    7829    xAI       Proprietary

2       4       Gemini-2.0-Flash:_Thinking_Exp-91.21    1385    +5/-5    13336   Google    Proprietary

2       2       Gemini-2.0-Pro-Exp-92.05       1379    +5/-6    11197   Google    Proprietary

2       1       ChatGPT-4o-latest_(2025-02-19)_94.29    1377    +5/-6    10529   OpenAI    Proprietary

5       2       DeepSeek-R1                     1361    +8/-7    5079    DeepSeek  MIT

5       8       Gemini-2.0-Flash-001            1356    +6/-5    9092    Google    Proprietary

5       2       o1-2024-4-2.17                  1353    +6/-5    15437   OpenAI    Proprietary

一部誤りのある箇所も含みますが、ほぼ正解しています。
誤: 1位のArena Score 1402→1462 など

PDFの要約も良い感じです。

画像生成はできない?

ややこしいのですが、Xアプリ上のGrokでは画像生成ができてWeb上ではできません。

X上では生成できる
Web上では生成しているけど表示されない…?

画像生成に関してはXアプリから利用しましょう。

Grok3のコンテキストウィンドウ

これ先にお伝えすると、Grok3のコンテキストウィンドウは100万トークンという主張と、12.8万トークンという主張があります。
ファクトベースでお伝えすると、Grok公式には以下のように記載されています。

Grok 3 は、100 万トークンのコンテキスト ウィンドウ (以前のモデルの 8 倍) を備えており、指示に従う精度を維持しながら、膨大なドキュメントを処理し、複雑なプロンプトを処理できます。

https://x.ai/blog/grok-3

一方でこういう主張もあります。

モデルには1M機能がありますが、今のところ128Kで機能しています。

これ、xAIの中の人なんですよねぇ…
なので100万トークン備えているけど実際は12.8万トークンで稼働しているよ、というのが正でしょうか。この辺の情報は確定したら更新します。

Grok3の感想

まだまだ触る必要がありますが、実際に使ってみて性能の高さに驚きました。これが無料で使えるのはありがたいです🙏
GrokはXとの関連性が強いのでX上の情報を学習する、X上の情報を参照する、といったアプローチができるのは大きなアドバンテージだと思います。
一つ気になったのは日本語への対応は少し弱いかなという印象です。
例えば、同じ数学の問題でも日本語より英語で質問した方が正答率は上がります。
まあ、これは他社のAIモデルでも同じことが言えますがDeep Search機能を使っていても日本語あまり得意じゃなさそうという印象を受けます。
より精度高く利用したい場合は英語で質問する方法もアリですね。

【note読者限定】生成AIのおすすめツールは?

  • 生成AIは何を使えばいいか分からない

  • もっと業務効率化に貢献するツールを知りたい

  • ChatGPT以外のAIツールを知りたい

こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。よりAIの情報をキャッチアップしたい人はチェックしてみてください。

👉資料を受け取る【無料】

noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

いいなと思ったら応援しよう!

この記事が参加している募集