【徹底比較】ChatGPTに「DeepResarch」登場。GeminiやGensparkの同機能と結果を比較

2025年2月5日 07:00

ChatGPTにDeepResarch（ディープリサーチ）機能が登場。他のAIサービスと比較したい

以前、Voicyで「2時間ほどかかるリサーチ作業をAIに任せたら、わずか5分で終わった」という話をしたことがあります。いわゆる「DeepResearch」というAIエージェントがWeb調査を自動化してくれるという内容でしたが、そこへついにChatGPTからも、同様の調査機能が登場して話題になっています。

実は「DeepResearch」という名称を持つAI機能は他にもありましたが、ChatGPTの新機能はアウトプットの品質と精度が高いということで、各所で評判になっているのです。私も早速試したのですが、使い勝手が思った以上に良く、これならVoicyでも紹介したいと思うほど役立ちそうだと感じています。

もちろんGoogleのGeminiや、検索特化型のGensparkにも同じようなDeepResearch機能が存在しますが、比較するとそれぞれ違った得手不得手があり、ChatGPTが完璧とはいえないものの、総合的にはもっとも満足度が高いという印象を受けました。とはいえ、検索情報の正確性では一部Gensparkの方が良かった部分があるのも事実なので、この記事ではChatGPTのDeepResearchを中心に、他サービスのDeepResearchとどんな違いがあったのかを述べていきます。

※ここからは、以下のVoicyでの音声配信の文字起こしを基にAI記事化しています。詳細はVoicyでお聴きください。

ChatGPTの「DeepResearch」とは

ChatGPTのDeepResearchが正式に発表されたのは、2月3日の朝9時です。OpenAI社が東京からライブ配信を行い、リアルタイムで新機能のデモンストレーションをしていました。

この日はソフトバンクグループの孫正義氏とOpenAIのサム・アルトマンCEOが共同でトークセッションを実施し、企業向けAIサービスを展開する合弁会社「SB OpenAI Japan」の設立を発表したタイミングでもあります。

また企業向けのAIサービス「クリスタルインテリジェンス（Crystal Intelligence）」も同時発表されました。私が思うに、日本でのサービス強化やプロモーションの意図もあって、わざわざ東京から朝9時にライブ配信をしたのだろうと推測しています。

DeepResearchという機能自体は、現在はChatGPTの最上位プランである月額200ドルのProプランのユーザーのみが利用できる形になっています。

今後、Plusプランなどにも徐々に開放されていく予定ですが、私自身はもともとProプランに入っていたので、この機能が使えるようになった瞬間に試すことができました。

ChatGPTの画面には新しく「DeepResearch」ボタン（日本語名では「詳細なリサーチ」ボタン）が増えており、そのボタンにチェックを入れてから質問をすると、5分～30分ほどかけてWeb上のさまざまな情報源を検索し、結果をまとめたレポートを作成してくれます。連続的にタスクが実行されるため、ブラウザを閉じていても問題なく、タスク完了後にChatGPTを開けばレポートが届いているのです。これが非常に便利で、まさにリサーチ会社に外注するようなイメージでAIに調査を任せられる点が従来のChatGPTとは少し異なります。アウトプットは長文のレポート形式で、調べたデータとその出典URLが添付されるという本格的な仕上がりになっています。

実際に「DeepResearch」を使って、過去10年のデータを調査して将来5年を予測させてみた

ChatGPT ディープリサーチ
・過去10年のデータを調査
・将来5年の予測
・リサーチが終わったらグラフ化

テーマは「ExcelのMOS試験」
受験者数の10年の推移と、これから5年の予測。

まずデータの調査はきめ細かく、Web上に散在する情報をかき集めて年表としてテーブル化してくれた。… pic.twitter.com/fCF4r92Yx4
— エクセル兄さん(たてばやし淳)@AI時代のExcel術_書籍多数 (@excel_niisan) February 3, 2025

私は今回、DeepResearchを使って「Excelの資格試験MOSに関する日本国内の過去10年間の受験者数推移と、今後5年間の成長予測を立ててもらう」というリサーチを行いました。

[プロンプト]
Excelの日本国内での資格試験（MOS）の過去の受験者数の推移と今後の成長予測過去10年は欲しい。将来予測は5年。現在の企業・組織の人材におけるExcelスキルのニーズ、業務自動化ニーズ、データ分析スキルのニーズなどを加味して欲しい。生成AIの台頭によるスキル需要の変化も加味して。

予測にあたっては、企業や組織におけるExcelスキルのニーズや業務自動化の進展、データ分析スキルの需要増加、さらには生成AIの台頭によるスキル需要の変化まで考慮してほしいと伝えました。

実行ボタンを押すと、ChatGPTはいきなり調査を開始するのではなく、「調査する前に確認したい事項がある」といくつか質問を返してきました。

私はだいたい希望通りだったのでOKと返事をして、さらに企業ニーズや資格試験としてのMOSの重要性を踏まえた分析が欲しいと伝えました。

そして実際にリサーチをスタートすると、約8分ほどで結果が届きました。

[1]データ収集

そこには2013年から2024年にかけての累計受験者数の変化や、年表に近い形での推移がまとめられており、さらにデータの引用元URLも掲載されています。たとえば2013年は累計330万人程度だったのが、2024年時点では520万人を超えているといった推移が示されていて、2020年から2021年にかけては新型コロナウイルスの影響で一時的に受験者数が落ち込んだとの解説も添えられていました。

[2]要因を分析

ここまでは単なる「調べもの」ですが、DeepResearchの本領はこの先の予測分析です。

今後5年間の成長予測にあたって、ChatGPTはExcelスキル需要の変化、RPAなどの業務自動化の進展、データ分析スキルの重要性、そして生成AIの台頭がどう影響するかを総合的に考察していました。生成AIによるプラス面としては、AI時代でもExcelの基礎を理解していることは企業でも評価されるだろうし、AIの回答の正否を判断するための土台となるスキルが必要になるという見方が示されていました。逆にマイナス面としては、AIが高度化するほど「資格なんて不要では」と考える層が増える恐れもあるため、受験者数が減る可能性があるというのです。

[3]将来予測

そこからさらに3つのシナリオを提案していて、これまで通り緩やかに成長するベースラインシナリオ、DX推進で需要が増大する楽観シナリオ、そしてAI普及でスキル需要が奪われる悲観シナリオ、それぞれの可能性を言及していました。最終的な結論としては、年率2〜3％程度の伸びで2030年頃には累計600万人前後に達するという中程度のシナリオがいちばん現実的ではないかという見解が示されていました。実際には景気や技術動向次第で上下にぶれるため、あくまで参考値ですが、調査結果としてはとても説得力がありました。

さらに私はChatGPTに対して「では、過去の推移と将来の3つのシナリオをグラフ化してほしい」と頼んでみたところ、きれいに3本のラインが分岐するような予測グラフを提案してくれました。各データの根拠となったURLも示されたままで、非常にわかりやすいビジュアルになっていました。単なるWeb検索代行ではなく、そこから仮説を立てて複数シナリオを展開して、最後にグラフで見せてくれるという一連の流れは、まるでプロのリサーチャーに依頼したような満足度の高い結果だったと思います。

▼ レポートの全文は、以下のチャット履歴から読むことができます。ただし、グラフは表示されません。

Googleの「Gemini」との比較

実は同じ質問をGoogleのGemini（Advancedプラン）にも投げてみました。
Geminiは2024年後半にDeepResearch機能が先行してリリースされていたAIで、私はVoicyでExcel関連の総まとめを放送するときにも何度か助けられました。

[1]データ収集

ただ今回のMOSの受験者数推移と将来予測の件では、過去10年分の推移データを取得できなかったのか、ほとんど予測だけのレポートが出てきました。

[2]要因を分析

しかも生成AIの影響についての考察も、「AIがExcelを自動化する可能性があるので今後の動向を注視する必要がある」という一般論にとどまり、ChatGPTが示したプラス面とマイナス面の具体例には及ばない印象です。3つのシナリオという構成は同じでしたが、踏み込みの度合いが浅かったと感じました。

[3]将来予測

さらに、ChatGPTのDeepResearchが行ったような「プラス面とマイナス面を両方書き出し、今後5年間で年率2〜3％ほどの緩やかな成長を見込む」などの具体的予測は、Geminiのレポートからはあまり得られませんでした。もちろん、「ポジティブシナリオ」「中立シナリオ」「ネガティブシナリオ」といった大きな視点わけは示されていたのですが、その中身は「AI化でニーズが高まる可能性」「DXの広がりが需要を伸ばすかもしれない」「スキルの重要性低下で需要が横ばいの可能性」といった一般論にとどまりがちでした。

GeminiのDeepResearchは、まず検索を自動化して報告するという点では非常に便利です。しかし、今回のように「過去の推移データを詳しく列挙してほしい」という指示に対しては、やや弱い結果になりました。加えて、生成AIの影響分析という観点でも、Geminiは総論的な言及が多く、チャット形式で追究すれば深められる可能性はあるものの、ChatGPTのDeepResearchが示してくれたような「資格不要論VS資格の重要性再認識」という踏み込んだ分析までは至らなかったと感じています。
もちろん、私がやった検証は一件だけですし、他のテーマならGeminiのほうが強みを発揮するかもしれません。それでも、今回に限っていえば「過去データの収集」と「将来シナリオの緻密さ」という点で、ChatGPTのDeepResearchのほうが一枚上手だったという印象を受けました。

▼Geminiのレポート全文はこちらから読めます。

「Genspark」との比較

「Genspark」は検索特化型のAIサービスとして知られています。最近のアップデートで追加された「DeepResearch」モードを使うと、やはり数分から数十分かけてWebを巡回し、まとめレポートを提出してくれます。

私はGeminiと同様に、Gensparkに対しても「MOS試験の過去10年分推移と、今後5年の需要予測をAIや自動化の視点で考察してほしい」と依頼しました。

[1]データ収集

実際にGensparkから返ってきたレポートには、年表に近い形で「2015年には累計350万人を突破」「2016年には380万人に到達」といった情報が書かれていました。

このとき引用されていたのが、MOS試験を日本国内で運営しているオデッセイコミュニケーションズのプレスリリース（PR TIMES）で、比較的公式性の高いデータを根拠として示していたのです。一方、ChatGPTのDeepResearchが示したデータの中には、公式ソースではなく一般ユーザーがまとめたブログやコミュニティサイトを参照している部分がありました。

そのため、年度ごとの受験者数の数字が多少食い違う場面も見られ、Gensparkのほうが実は“正確な一次ソース”を提示していたケースがあったことに驚きました。

[2]要因を分析

ただし、Gensparkはデータを拾ってくるのは優秀なものの、そのデータをどう分析して今後5年間のシナリオに落とし込むかという部分になると、やや消化不良な印象でした。

さらに、Gensparkでは「2025年にはDXが進んでExcelスキル需要が上がる」「2026年には業務自動化がさらに進展するので需要が維持される」「2027年には生成AIが拡大」など、ざっくりとしたトピックをリスト化したような文章が続きました。私が依頼した「4つの観点」をただ年代ごとに言い換えただけに見えるため、深い洞察や具体的な根拠付けには乏しいように感じました。

[3]将来予測

最終結論も「企業によるオフィス系スキル需要は今後も高まる可能性があり、MOS試験は重要性を維持するだろう」と大まかに述べるにとどまり、「ChatGPTのDeepResearchが示したような“年率2〜3％成長が妥当”といった数字面での予測」や「楽観・中立・悲観シナリオの具体的な根拠づけ」がもう一歩欲しい印象でした。

▼Gensparkのレポートは以下から全文読めます

https://www.genspark.ai/spark?id=bc3199d6-916f-4d65-ae71-aad1faa13d53

まとめと今後の展望

今回私は、ChatGPTのDeepResearchを中心に、GoogleのGeminiやGensparkと比較しながら、「過去10年のMOS受験者数を調査し、今後5年の予測とグラフ化を依頼してみる」という使い方を試しました。

DeepResearchは現在PRoプラン（月額200ドル）のみ利用可能で、1か月に最大100回ほどの検索タスクを投げられるようですが、近い将来プラスプランやTeamユーザーにも展開されるそうです。OpenAIとしては、安全性のテストや精度確認を進めながら、順次リリース対象を拡大していくとのアナウンスを行っています。

DeepResearchは今のところWeb検索が中心ですが、将来的には企業の内部資料や特定のデータソースに直接アクセスして調査することも想定しているとのことで、まさに「AI調査員を雇う」ような体験が普通になっていきそうです。しかもChatGPTにはオペレーターと呼ばれる、リアルタイムにWebのマウス操作やキーボード操作を実行できる機能も構想されているそうで、非同期での大規模調査はDeepResearch、リアルタイム操作が必要な場面はオペレーター、という二つのエージェントを組み合わせることで、人間の業務効率が格段に上がる未来が見えてきます。

ただし、今回利用してみて強く感じたのは「指示を丁寧に出すことが重要だ」という点です。DeepResearchは最短5分、長いと30分かかります。もし曖昧な指示をしてしまうと、せっかく時間をかけて調査してくれたのに全然違う方向のレポートが返ってくる可能性があるのです。仕事の依頼でも要件定義が大事だとよく言われますが、それと同じように「何をどの程度深く調べてほしいのか」「どんな形でアウトプットしてほしいのか」をきちんと伝える必要があります。これをうまく使いこなせば、一人の人間が同時に複数の調査をDeepResearchにやらせて、その間に別の作業を進めるというやり方も実現できます。まさにAIの力を借りて自分の生産性を倍増させる時代になってきたと感じます。

以上が、ChatGPTのDeepResearchが登場した背景と実際に使ってみた体験、それからGoogleのGeminiやGensparkといった他のDeepResearch機能との比較、そして今後の展望についての私の考察です。Proプラン限定とはいえ、今の時点でもかなり高い完成度で調べ物から考察、予測、レポート化までやってくれるので、今後さらに機能拡充が進めばいよいよAIの活用シーンが広がっていくと思います。GeminiやGensparkもそれぞれ違う強みを持っているため、適材適所で使い分けながら、より効率の良いリサーチ手法を追求していきたいです。私もこれから引き続きDeepResearch機能を試してみて、面白い事例があればまた紹介していこうと思っています。今後さらにDeepResearchが進化していけば、個人が短時間で複数の調査を並行して進められるのが当たり前になるかもしれません。指示を的確に出すことが大切だと再認識しながら、AIとの共存時代を楽しんでいきたいです。

【徹底比較】ChatGPTに「DeepResarch」登場。GeminiやGensparkの同機能と結果を比較

ChatGPTにDeepResarch（ディープリサーチ）機能が登場。他のAIサービスと比較したい

ChatGPTの「DeepResearch」とは

実際に「DeepResearch」を使って、過去10年のデータを調査して将来5年を予測させてみた

[1]データ収集

[2]要因を分析

[3]将来予測

Googleの「Gemini」との比較

[1]データ収集

[2]要因を分析

[3]将来予測

「Genspark」との比較

[1]データ収集

[2]要因を分析

[3]将来予測

まとめと今後の展望

いいなと思ったら応援しよう！