Grok 3：この新しいAIがインターネットを席巻...🤯

2025年2月18日 19:43

7,659 文字

本日、Xから大きなアップデートがありました。Grok 3へのアクセス権を得たので、早速テストしていきます。ご覧の通り、2つの新しいモードが追加されています。Grok 3には、最も強力なモデルとやり取りするための「deep search」と「think」という2つの新しいモードが導入されました。内部に推論モデルも組み込まれているようです。
これらのモードは切り替えることができます。ChatGPTとGrokを比較すると、ブランディングや色使い、ボタンのアイコンなどが非常によく似ています。deep researchを選択したり解除したりする様子も似ていて、bizarre（奇妙）なほどです。
いずれにせよ、早速テストしていきましょう。Grok.comにもアクセスできるようになりました。TwitterやXと呼ばれるプラットフォーム内だけでなく、専用のユーザーインターフェースを持つGrokの新バージョンがリリースされ、チャットを直接Twitterでシェアすることもできます。
まずは基本的なことから試してみましょう。「iで終わる犬種を挙げてください」と質問してみます。これは以前ライブストリームで完全に失敗したので、今回はどれくらい賢く、正しく処理できるか確認したいと思います。
実際にチャット内で再び失敗しているのが分かります。良くない出発です。「iで終わる犬種を挙げてください」という質問に対して、「shiba inu」と返答していますが、これらの単語はどちらもiで終わっていません。
では、新しいチャットに切り替えて、thinkモードで試してみましょう。Grokの論理的なバージョン、より良い出力を提供できる推論モデルを使用します。同じプロンプトを入力して「iで終わる犬種を挙げてください」と聞いてみると、考える時間を示すタイマーが表示され、考えていることを正確に示してくれます。
下向き矢印をクリックすると、DeepSeekによく似た方法で展開されているのが分かります。これらのUIは非常によく似た感じになってきています。今回はより良い出力が得られているようです。前回失敗した課題を克服し、「以下の犬種がiで終わります」と正しく答えています。テストに合格しました。
より知的な答えを求める場合、reasoning（推論）モデルは通常のGrok 3バージョンよりもはるかに優れています。ただし、これはGrok 3ベータ版であり、Grokのメインバージョンではないことに注意してください。
イーロンが最近のストリームで話していた別の興味深い点として、ゲームを作れることがあります。これを試してみましょう。「スネークゲームとスペースインベーダーを組み合わせたゲームを作成してください」と入力し、thinkモードに切り替えます。
以前のバージョンよりもこちらの方が気に入っています。推論モデルを使用することで、より良い出力が得られ、より知的な結果を提供してくれるからです。以前のGrokは基本的な回答は提供してくれましたが、それほど優れてはいませんでした。
さらに、Grok 3はTwitterやX上の最新のニュースや情報にリンクされているという利点があります。X上では人々が常に新しい情報や資料を投稿しているため、ChatGPTのような他のAIと比べて、より新しい最新のデータを持っているという利点があります。
thinkingモードは通常より時間がかかるようです。ChatGPTと比較してみましょう。同じ問題を与えてみます。これは推論モデルですが、より最新のモデルであるo3 miniに切り替えて、パフォーマンスを確認してみましょう。
ベンチマークを見てみましょう。Robert Scobbleのツイートが素晴らしい情報を提供しています。ライブストリームで公開されたGrok 3対Gemini、DeepSeek、Claude、GPT4のベンチマークを見ると、数学、科学、コーディングの面でGrokが大きくリードしています。
推論の面でGrok 3を比較したい場合、o3 mini、o1、DPC、Claude、Gemini、Flash2 Thinkingと比較すると、Grokがそれらのベンチマークでも圧倒していることが分かります。ただし、これらは必ずしも信頼性が高いとは限らないので、慎重に受け止める必要があります。
コードが表示されていますが、使用方法とインストール方法も詳細に説明されています。試しに、オンラインでプレビューできるようにゲームのHTMLコードを要求してみましょう。
読み込みにかなり時間がかかっていますが、ほぼ完了したようです。すぐに結果が得られることを期待しています。コーディングのスピードが印象的です。ChatGPTや他のAIがこれほど速くコーディングするのを見たことがありません。非常に詳細なコーディングを行っているようです。
HTMLコードの準備ができました。Live Weaveでテストしてみましょう。何も表示されません。全く機能していません。ChatGPTと比較してみましょう。
ChatGPTからのHTMLコードは実際に機能しています。ご覧の通り、スペースインベーダーとスネークゲームを組み合わせたものがChatGPTのコードから直接作成されています。しかし、Grok側では全く機能せず、白い背景に緑のブロックが表示されるだけで、デザインも優れていません。
良いスタートとは言えませんが、続けていきましょう。次は両方のAIに「魔法の絨毯に乗ったキリンの画像を生成してください」と指示してみます。deep thinkモードは必要ないので切り断して、ChatGPTでも同じ指示を出してみましょう。
Grokの方がはるかに速く応答し、画像の品質も非常に素晴らしいです。ChatGPTの画像と比べると、興味深さに欠け、現実味が感じられません。これがChatGPTの画像で、こちらがGrokの画像です。はるかに優れていることは明らかです。魔法の絨毯に乗って楽しそうに飛び回るキリンの姿が見事に表現されています。
コーディングに関しては、ChatGPTがまだ優位を保っています。Grokのコードは全く機能しませんでした。イーロンは、Grok 3を適切に評価するには約1週間かかると述べていましたが、現時点で見る限り、コーディングに関してはo3 miniの方が優れています。ただし、推論に関してはGrokは非常に印象的です。
他のことも試してみましょう。コンテンツ作成をテストします。このようなプロンプトをGrokに与えて、「SEO最適化された記事を作成してください」と指示します。これは単純な作業なのでDeep thinkは必要ありません。キーワードは「SEO training Japan」としましょう。
同時にChatGPTと比較してみましょう。応答速度が非常に速いのも素晴らしいです。ChatGPTで同じプロンプトを入力し、キャンバスモードを使用します。素晴らしいですね。並べて比較してみましょう。
「SEO training in Japan：オンラインで成功するためのノンセンスガイド」というヘッドラインは悪くありません。一方、ChatGPTは「SEO training in Japan：SEOをマスターしてGoogleを制覇しよう」としています。正直なところ、この中では前者を選びたいと思います。
ただし、ここで一般的な特徴が見られます。人間がこのような大きなダッシュを使用することは非常に稀ですが、Grokは最初の段落で2回も使用しています。
導入部を読むと、「トレーニングはただのバズワードではなく、ビジネスの本格的な成長を解き放つ鍵です。私はジュリアン・ゴールディーです。これまでの経験を紹介します。私はこの分野に没頭しており、ノイズを排除してVIを提供します」という内容です。
これは実際、より人間らしい読み方をしています。ダッシュは削除するようプロンプトに含めるべきですが、実際の文章は非常に人間らしく、うまく書かれています。コンテンツ全体を通して適切にフォーマットされており、架空のリンクではなく、コンテンツのファネルへのリンクも含まれています。
コンテンツ作成に関しては、間違いなくGrok 2よりも10倍優れています。コンテンツの長さも確認してみましょう。スクロールダウンして、どれくらいの長さかを見てみます。722語、悪くありません。ChatGPTの方は676語でした。Grok 3は約50語多く生成しました。
また、Twitter内で記事を直接投稿できる点も興味深いです。記事セクションがあり、これらの記事は非常に良い評価を得ています。例えば、この記事は3,700回の閲覧を記録しています。Grok内でコンテンツを生成し、トランスクリプトを与えて「これに基づいてコンテンツを作成してください」と指示するだけで、数千回の閲覧を得て、ファネルにユーザーを送ることができます。
これを自動化する方法を知りたい場合は、AI Profit Boardroomのリンクをコメント欄に記載していますので、そちらでビデオトランスクリプトの作成やAI SEOを使用したブログ作成に関する私の最高のヒントとプロセスを確認できます。
続けて、Deep searchオプションのテストも非常に楽しみです。基本的にChatGPTの月額200ドルのオプションや、1日5回の無料検索を提供するPerplexityのように、ウェブを検索することができます。それぞれの出力を比較して、最も良い応答を提供するのはどれか確認してみましょう。
すべてをリアルタイムでテストします。公平を期すため、それぞれで新しいスレッドを開始します。「Grok 3と最新のアップデートについて調査してください」とPerplexityのdeep research、Grok 3、そしてChatGPTのdeep researchで試してみます。
これらのツールすべてに課金していますので、ステップバイステップで詳細に比較して、最適な方法を示すことができます。Grok 3は驚くほど素早く応答を返してきます。ただし、途中で切れているようで、下の方で止まっているように見えます。
しかし、今また生成を再開しました。研究結果を信じられないほど速く生成しています。まだ「読み込み中」と表示されています。一方、ChatGPTは一部のポイントを明確にするよう求めてきましたが、今回はすべてを含めることにします。
通常、ChatGPTのdeep researchは約10,000語のレポートを生成し、30分以上かかります。また、月に100回までしか深い研究を行えません。Grok内のdeep searchには制限があるかもしれませんが、まだ分かっていません。Perplexityは1日5回の無料検索が可能で、それ以上必要な場合はプレミアムプランに加入する必要があります。
多くの場合、非常に詳細な10,000語の論文は必要ありませんが、Grok 3は検索エンジンそのものであり、多数のウェブページを見つけ出します。これはツイートだけを参照しているわけではありません。
実際に2つのセクションがあり、Grokからの「投稿」セクションと「ウェブページ」セクションがあります。ウェブからも情報を取得しているようです。これはほぼGoogleとChatGPTまたは他の検索方法の両方を置き換えるようなものだと感じます。非常に素晴らしいですね。
応答の内容を見てみましょう。投稿を参照していますが、これは1月29日、2月11日のものです。最近の投稿は見当たりません。例えば、今日行ったGrok 3に関するライブストリームには言及していません。
ウェブページセクションをスクロールすると、ライブアップデート機能があり、より最新の情報が含まれているようです。一方、Perplexityを使用すると、非常に最新の情報を参照します。これは文字通り今日、おそらく1時間前くらいの情報です。
Xは最新のデータを使用しているようですが、Grokはまだベータ段階で、100%準備ができているとは思えません。また、レポートの深さを見ると、こちらは421語ですが、Perplexityのコンテンツは973語あり、はるかに詳細です。さらに、コンテンツ内にソースが含まれていますが、Grok 3のDeep searchオプションではソースへのソースへの言及は見当たりません。ChatGPTはまだ時間がかかっていますが、他のどれよりも詳細で深い内容になることは確かです。
ただし、情報をどこからソースしているのか、本当に最新の参照を使用しているのかは分かりません。日付が表示されないからです。スピード、深さ、リソース、データの質を考慮すると、deep research agentsに関しては正直なところ、Perplexityを選びたいと思います。これが最も良いオプションだと考えています。
ただし、すでにGrokに加入している場合は、Grokも適切なオプションとなります。Perplexityが階層について何と言っているか見てみましょう。最新のデータを参照しており、例えばこれはCatalog.comのテストで、2月18日に投稿されたばかりです。
Grok 3 Miniは低レイテンシーのやり取りに最適化され、Grok 3 reasoningは複雑な問題解決用に設計されています。そして「big brain mode」が高度なクエリ用に有効化され、このモードは複数の推論エンジンを重ね合わせることで、PhD レベルの生物学や化学の問題で最先端の結果を達成しています。
リーダーとのベンチマークに関しては、最新の日付のデータを取り入れています。これははるかに優れた研究レポートだと言えます。さらに、収益化とアクセシビリティに関して、X プレミアム加入者は月額16ドルでGrok 3への基本アクセスを得られ、月50回のdeep searchクエリが含まれます。これが制限のようです。
Super Grokは月額30ドルで、この層では無制限の推論クエリ、優先APIアクセス、2月25日に予定されている音声モードなどの早期機能が提供されます。そして、Enterprise APIは大規模なものになると思います。記憶が正しければ、数千ドル程度だと思います。
これを最大限活用したい場合は、Super Grokがおすすめです。Grok.comを直接使用する場合、例えば「今日のニュースを教えてください」と尋ねると、ウェブをライブ検索して「2月17日現在、以下が主要なニュースです」と答えます。これもdeep researchに適しているようです。
さらに、チームと共有することもできます。リンクをコピーして共有できます。新しいincognitoを開いて確認してみましょう。また、Xで共有すると、Grok.comで作成したものを直接X上で共有できます。
興味深いのは、これらのページが直接Google上でインデックスされるかどうかです。例えば、Googleについての応答を作成した場合、Perplexityのページのように、その会話を共有してランク付けすることができるでしょうか。
予期せぬクエリでしたが、実際に会話全体がGoogle上でインデックスされているのが分かります。これらの応答はTwitterやその他の場所で共有できるだけでなく、Google上でもインデックスされます。これは今日立ち上げられたばかりですが、すでにインデックスされており、Grokには3ページのコンテンツが直接インデックスされています。
多くの人々がコンテンツを作成し、Grok.comは大量のトラフィックを獲得することになるでしょう。Perplexityのページが常にインデックスされているのと同じように、Grokのページも次々とGoogleでランク付けされているのが分かります。
イーロンの大胆な動きだと言えます。基本的にdeep search、thinkモード、ファイルの添付、画像生成、Googleのようなウェブ検索、Perplexityページのようなページ作成、Twitterからの最新データの取り込みなど、すべてを備えています。非常に野心的です。
さらにSuper Grokが登場予定で、Grok.com内には独自のUIもあります。いくつかのオプションがあり、データ分析、ブレインストーミング、画像作成、コーディングを選択できます。コードを選択して「スネークゲームの作成を手伝ってください」と入力してみましょう。Grok.com内にキャンバスオプションがあるか気になります。
はい、コーディングに関してはこちらの方が良いですね。独自のキャンバスセクションがあり、コードをラップしてコピーできます。「このゲームのHTMLを作成してください」と指示できます。ChatGPTとまったく同じように見えます。アイコンが少し異なるだけです。
ただし、ここで直接コードを実行することはできないようで、Live.comなど他の場所で実行する必要があります。ChatGPTとの類似性は驚くべきものです。
視聴ありがとうございます。Eメールやコンテンツ自動化、ソーシャルメディア、AIエージェントとワークフローの構築、ウェブ自動化、AI SEO自動化に関する私の最高のチュートリアルをすべて入手したい場合は、AIに興味を持つ135人のメンバーからなる素晴らしいコミュニティに参加してください。
週1回のコーチングコールでは、質問に答えることができます。今日サインアップすれば、明日のライブQ&Aコールに参加できます。さらに、Grok 3コースも追加予定です。現在はベータ価格ですが、近々値上げする予定なので、今のうちにサインアップすることをお勧めします。リンクはコメント欄に記載しています。
無料の1対1のSEOストラテジーセッションを希望する場合も、コメント欄のリンクから申し込めます。ウェブサイトを0から月間145,000PVまで成長させ、自動的に数十万ドルの売上を生み出す方法をお見せします。
この無料のリンクビルディング加速セッションでは、無料のSEO支配計画を入手でき、SEOリンクビルディングの秘密を発見し、1対1で質問に答えます。あなたのウェブサイトに最適なリンクビルディング戦略を学び、私たちの成功事例に基づいて、より良いディスビルディングと高いアンドゥトラフィックでランクを素早く上げる方法を学べます。
コメント欄のリンクから申し込みください。視聴ありがとうございました。また次回お会いしましょう。さようなら。

Grok 3：この新しいAIがインターネットを席巻...🤯

いいなと思ったら応援しよう！