見出し画像

DifyでDeep Research ---Tavily Searchって?

はじめに

生成AIでは、今、Deep ResearchとThinkingが大流行り。

DeepResearchは、たぶんGenSparkが最初に始めたのを、Feloが広げ、GoogleがGeminiで乱入して、OpenAIやPerplexityが火をつけ、DeepSeekやQwenさらにGrok3とかで今や常識になったという感じでしょうか。
これは、とても便利です。でも、御本家の2社は大丈夫だろうか。心配。

一方、Thinkingは、GoogleがThinkingモデルを出したのが最初ではないかと思います。2025年になって、その機能をもったLLMが続々と登場。こちらは、DeepSeek-R1あたりでブームに火がついたという印象です。ちなみに、DeepSeek Chatでは、DeepThinkとSearchという2つのボタンがあって、2つをオンにすると、DeepResearch+Thinkingと同じということのようです。

DifyとDeepResearch/Thinking

さて、Difyの "アプリの探索"には、お手本となるフローが最近増えてきていて、とても参考になります。
そしてDeepResearchとThinkingも登場しています。

前者のお手本は、その名称も "Deep Research"。
この作者は、日本の方で、岸田崇史 さん(https://x.com/omluc_ai)です。
さっそく、Xでフォローさせていただきました。

ここで提示されているチャットフローで、情報検索用に用いられていたツールがTavily Searchです。

このツールは、Difyに登場した時に名前は知っていたのですが、その特徴など不勉強でよく知りませんでした。
そこで、導入/試用の準備として、Gemini のDeepSearchで3種の検索用APIを調べてみました。

というのも、検索といえば、Google。一応、Difyでつかえるような設定はできてたつもりですが、DeepResearch的な設定は、このままでは結構難しい、とつらつら考えていたからです。

検索用APIの比較調査

比較したのは、Tavily とGoogle, DuckDuckGoの3種の検索用APIです。それぞれの特徴と長所、短所等を比較検討してもらいました。
以下は、その検索結果です。GoogleのGemini DeepResearchの出力結果をそのまま転記します。

ちなみに、Geminiの場合、この出力結果をそのままGoogleDocに変換できるボタンがあります。つまり、即、Google Driveに入りますので、とても便利です。出力ファイル中の表や見出しのフォーマットも整っています。

通常の使い勝手は、おそらくDifyのフローよりもいいと思います。
わざわざDifyを使うメリットは、常に最先端のLLMと検索ツールとを組み合わせることができる、ということなどでしょうか。

結論

出力結果の引用が長いので、先に調査結果の印象を述べます。

Tavily Searchは、LLMらやRAG、そして下記引用では述べていませんがGrok3(DeepResearch) によるとLangChainなどにも使いやすいとのことで、今回のようなDeep Research用には最適の検索用APIのようです。

今後ともDifyでの適用事例として本APIはとても重要と思われます。
とても参考になりました。

以下、調査結果の引用。

Tavily Search、Google Search、DuckDuckGo API の比較(by Gemini DeepResearch)

はじめに

今日の情報化社会において、Web 上の膨大なデータから効率的に情報を取得することは、ビジネスから学術研究まで、あらゆる分野で重要性を増しています。

そのため、Web 検索API を利用した情報収集は、その効率性と網羅性から注目を集めています。

本稿では、AI エージェント向けに設計された Tavily Search API、汎用性の高い Google Search API、プライバシー重視の DuckDuckGo API の3つを比較し、それぞれの利点と劣る点、ユースケースにおける適合性、そして今後の展望について考察します。

各APIの概要

Tavily Search API

Tavily Search API は、LLM (Large Language Model) や RAG (Retrieval-Augmented Generation) アプリケーション向けに最適化された検索エンジンです。

リアルタイムのウェブアクセス、正確な結果、AI 処理に最適化された関連コンテンツスニペットを提供します 1。 さらに、Tavily Search APIは、一回のAPI呼び出しで最大20のサイトから情報を収集し、独自のAIを使用して最も関連性の高いソースとコンテンツをスコアリング、フィルタリング、ランク付けします。このAIによる最適化により、LLMエージェントにとってより効率的かつ正確な検索が実現します 2。

主な機能

  • 検索、スクレイピング、フィルタリングを単一の API 呼び出しで実行

  • 検索深度とドメイン管理のカスタマイズが可能

  • LLM および RAG アプリケーションに最適化

  • Python SDK と REST API 統合をサポート

  • 事実的で偏りのない情報収集を保証 3

Tavily Extract API

Tavily Search API に加えて、Tavily は Tavily Extract API も提供しています。この API を使用すると、ウェブサイトから生のコンテンツを効率的に取得できます 4。データ収集、コンテンツ分析、調査などに役立ちます。

Tavily Extract API の主な機能

  • 複数のウェブサイトから生のコンテンツを効率的に取得

  • データ収集、コンテンツ分析、調査などに最適

  • Tavily Search API と組み合わせて、より詳細な情報収集が可能

Google Search API

Google Search API は、Google の検索機能をアプリケーションやウェブサイトに直接統合するためのツールです。

言語、地域、日付などのパラメータを使用して検索をカスタマイズし、ニーズに合わせて調整できます 5。

主な機能

  • ウェブページ、画像、動画、ニュース記事など、包括的な検索結果を提供

  • 言語、地域、コンテンツの鮮度などを指定できる高度なクエリ機能

  • ドメインによるフィルタリング、コンテンツタイプの除外、特定のタイプの結果の優先順位付けなど、カスタマイズ可能な結果

  • JSON および XML 形式のサポート

  • リアルタイムのデータアクセス

  • API キーと OAuth 2.0 認証によるセキュリティ強化

  • ページネーションのサポート

  • 地理位置情報によるフィルタリング

  • モバイルフレンドリーな検索

  • 評価、レビュー、イベントの詳細などの追加情報を提供するリッチスニペットのサポート 6

Google Search API でサポートされているデータ型

Google Search API は、多様なデータ型とフォーマットをサポートしています。これにより、開発者は API から取得したデータを様々な用途に活用できます 7。

主なデータ型

  • any: 任意の型

  • number: 単精度32ビット IEEE 754 浮動小数点数

  • object: JavaScript オブジェクト

  • string: 任意の文字列

  • boolean: 真偽値 (true または false)

  • integer: 32ビット符号付き整数 (int32) または32ビット符号なし整数 (uint32)

  • string: 64ビット符号付き整数 (int64) または64ビット符号なし整数 (uint64)

  • string: バイト列 (byte)

  • string: 日付と時刻 (date, datetime, google-datetime)

  • string: 期間 (google-duration)

高度な検索パラメータ

Google Search API は、ludocid、lsig、kgmid などの高度な検索パラメータをサポートしています。これらのパラメータを使用することで、特定の Google マイビジネスリスティング、ナレッジグラフリスティング、またはキャッシュされた検索パラメータに基づいて検索結果を絞り込むことができます 8。

DuckDuckGo API

DuckDuckGo API は、ユーザーのプライバシーを重視した検索エンジンです。

ユーザーの追跡や個人データの収集を行わず、偏りのない検索結果を提供します 9。

主な機能

  • トピックの概要、カテゴリ、曖昧さ回避、!bang リダイレクトなどのインスタントアンサーへの無料アクセス

  • HTML からテキストを削除する no_html パラメータ

  • HTTP リダイレクトをスキップする no_redirect パラメータ

  • 検索語を指定する q パラメータ

  • 曖昧さ回避をスキップする skip_disambig パラメータ 10

DuckDuckGo API でサポートされているクエリタイプ

DuckDuckGo API は、キーワード検索、フレーズ検索、ブール検索など、様々なクエリタイプをサポートしています 11。

  • キーワード検索: 特定のキーワードを入力して関連する結果を取得する最も簡単な方法です。

  • フレーズ検索: より正確な結果を得るために、フレーズを引用符で囲むことができます。これにより、API は正確な単語の並びを検索し、無関係な結果を除外します。

  • ブール検索: DuckDuckGo API は、AND、OR、NOT などのブール演算子をサポートしており、検索をさらに絞り込むことができます。

DuckDuckGo API の使用制限

DuckDuckGo API の使用には、1日の使用制限があります。これは、匿名性を維持しながら API の悪用を防ぐための措置です 12。

各APIの利点と劣る点

効率性

  • Tavily Search API: 検索、スクレイピング、フィルタリングを単一の API 呼び出しで実行できるため、情報収集プロセスを効率化できます 3。また、LLM や RAG アプリケーション向けに最適化されているため、AI エージェントによる効率的な調査に役立ちます 2。

  • Google Search API: リアルタイムのデータアクセスを提供し、最新の情報を迅速に取得できます 6。また、高度なクエリ機能により、必要な情報を絞り込むことができます。

  • DuckDuckGo API: インスタントアンサー API は、特定の質問に対する回答を直接取得できるため、効率的な情報収集に役立ちます 10。

網羅性

  • Tavily Search API: 1回の API 呼び出しで最大20のサイトから情報を収集し、独自の AI を使用して最も関連性の高いソースとコンテンツをスコアリング、フィルタリング、ランク付けします 2。これにより、包括的なデータ収集が可能になります。

  • Google Search API: ウェブページ、画像、動画、ニュース記事など、幅広い種類のデータを網羅的に取得できます 6。

  • DuckDuckGo API: インスタントアンサー API は、DuckDuckGo のインスタントアンサーデータベースへのアクセスを提供しますが、完全な検索結果やリンクは提供しません 13。そのため、データの網羅性という点では劣ります。

コストパフォーマンス

Tavily Search API は無料プランで月間1,000回のリクエストが可能で、有料プランでも柔軟な料金体系とAPI呼び出し制限により、コストパフォーマンスに優れています 1。 Google Search API はカスタム検索JSON APIで1日あたり100件の検索クエリを無料で提供しますが、追加のクエリは1000件あたり5ドルかかります 16。 DuckDuckGo API のインスタントアンサー API は無料で利用できますが、完全な検索結果を取得するには、SerpAPI などのサードパーティAPIを利用する必要があり、その場合は別途料金が発生します 10。

使いやすさ

  • Tavily Search API: Python SDK と REST API 統合をサポートしており、既存の AI ワークフローにシームレスに統合できます 3。また、包括的なドキュメントとサンプルが用意されているため、開発者は容易に API を利用できます。

  • Google Search API: JSON および XML 形式をサポートしており、データの解析と操作が容易です 6。また、Google Cloud Platform Console から API キーを取得するだけで利用を開始できます。

  • DuckDuckGo API: シンプルな API エンドポイントとパラメータにより、容易に利用できます 10。

開発者サポート

Tavily Search API は、有料プランのユーザーにメールサポートを提供し、エンタープライズプランには、専用のSlackチャンネル、アカウントマネージャー、テクニカルアシスタンスのためのAIエンジニア、定期的なチェックインによるホワイトグローブサポートが含まれています 1。 Google Search API は、Google Workspace の管理者にメールサポートを提供し、Stack Overflow などのコミュニティフォーラムや Issue Tracker での質問やフィードバックの送信も可能です 18。 一方、DuckDuckGo API は、公式ウェブサイトに API のドキュメント、FAQ、パートナーシップページがあるものの、開発者向けのサポート情報は限られており、専用の開発者サポートフォーラムやメールサポートはありません 19。

特定のユースケースにおける各APIの適合性

各APIの最新情報や今後の展望

Tavily Search API の最新情報と今後の展望

Tavily Search API は、比較的新しい API であるため、最新情報や今後の展望に関する公式な情報は限られています。しかし、開発者コミュニティでは、API の機能強化、ユースケースの拡大、開発者サポートの充実などが期待されています 20。 特に、非同期クライアントのベータ版がリリースされ、Python パッケージのバージョン 0.3.4 で利用可能になりました。非同期クライアントのインターフェースは同期クライアントと同じですが、すべてのメソッドが非同期である点が異なります 21。

Google Search API の最新情報と今後の展望

Google は、API の機能強化、パフォーマンスの向上、セキュリティの強化などを継続的に行っています 22。 また、AI 技術を活用した新しい検索機能の開発にも取り組んでおり、今後の API の進化に期待が持てます。具体的には、2025 年には、3 つのメジャーバージョン (V19、V20、V21) と 2 つのマイナーアップデート (V19_1、V20_1) が計画されており、各バージョンには 12 か月のサポート期間が設けられています 23。

DuckDuckGo API の最新情報と今後の展望

DuckDuckGo は、プライバシー保護を重視した検索エンジンの開発を継続しています。また、ユーザーエクスペリエンスの向上、検索結果の精度向上、モバイルアプリの機能強化などにも取り組んでおり、今後の API の発展が期待されます 9。 最新情報としては、DuckDuckGo Privacy Pro の VPN サーバーの増加、カスタム DNS IP オプションの追加、アプリ/サイトの VPN からの除外、EU での Pro 機能の導入などが挙げられます 24。

結論

本稿では、Tavily Search API、Google Search API、DuckDuckGo API の3つの Web 検索 API を比較しました。それぞれの API は、機能、料金体系、データの種類、制限事項、開発者サポート体制などが異なり、ユースケースによって最適な API が異なります。

Tavily Search API は、AI エージェント向けに設計されており、LLM や RAG アプリケーションとの連携に優れています。Google Search API は、汎用性が高く、幅広い種類のデータを網羅的に取得できます。DuckDuckGo API は、プライバシー保護に重点を置いており、ユーザーの追跡や個人データの収集を行いません。

API を選択する際には、それぞれの利点と劣る点、ユースケースにおける適合性、そして今後の展望を考慮することが重要です。 Web 検索 API は、AI 技術の進化やプライバシー保護の重要性の高まりなどを受けて、今後も進化していくと考えられます。ユーザーは、それぞれのニーズや目的に最適な API を選択し、Web 上の情報を効率的に活用していくことが重要です。

Cf; 111 件のウェブサイトをリサーチしました

レポートのためのリサーチを行う際、Gemini はユーザーに代わりウェブの検索と関連ウェブサイトのコンテンツのブラウジングを行います。

注:レポートには引用文献として下記が表示されます。

引用文献
1. Tavily, 3月 3, 2025にアクセス、 https://tavily.com/
2. Introduction - Tavily Docs, 3月 3, 2025にアクセス、 https://docs.tavily.com/guides/introduction
3. Tavily: Features, Use Cases & Alternatives - Metaschool, 3月 3, 2025にアクセス、 https://metaschool.so/ai-agents/tavily
4. Tavily Extract, 3月 3, 2025にアクセス、 https://docs.tavily.com/api-reference/endpoint/extract
5. What You Need to Know About Google's Search API - Promevo, 3月 3, 2025にアクセス、 https://promevo.com/blog/google-search-api
6. Top 10 Features of Google Search API You Should Know | by Mayur Shinde - Medium, 3月 3, 2025にアクセス、 https://mayurashinde.medium.com/top-10-features-of-google-search-api-you-should-know-0382be1f774e
7. Type and format | Google APIs Discovery Service, 3月 3, 2025にアクセス、 https://cloud.google.com/docs/discovery/type-format
8. Google Search Engine Results API - SerpApi, 3月 3, 2025にアクセス、 https://serpapi.com/search-api
9. DuckDuckGo API - APImetrics API Directory - key data on 300+ top providers, 3月 3, 2025にアクセス、 https://apicontext.com/api-directory/search/duckduckgo/
10. DuckDuckGo Instant Answer API | Documentation | Postman API Network, 3月 3, 2025にアクセス、 https://www.postman.com/api-evangelist/search/documentation/bdkqiym/duckduckgo-instant-answer-api
11. Extract DuckDuckGo Data with Crawlbase - Free Trial, 3月 3, 2025にアクセス、 https://crawlbase.com/scrape-duckduckgo
12. Does Duck.ai have usage limits? | DuckDuckGo Help Pages, 3月 3, 2025にアクセス、 https://duckduckgo.com/duckduckgo-help-pages/duckai/usage-limits/
13. DuckDuckGo APIs - Rapid API, 3月 3, 2025にアクセス、 https://rapidapi.com/collection/duckduckgo-api
14. LLM Enhanced Web Search: The Tavily & Lang Chain - Kaggle, 3月 3, 2025にアクセス、 https://www.kaggle.com/code/marcinrutecki/llm-enhanced-web-search-the-tavily-lang-chain
15. Rate Limits - Tavily Docs, 3月 3, 2025にアクセス、 https://docs.tavily.com/guides/rate-limits
16. Custom Search JSON API | Programmable Search Engine - Google for Developers, 3月 3, 2025にアクセス、 https://developers.google.com/custom-search/v1/overview
17. Tavily - Phidata, 3月 3, 2025にアクセス、 https://docs.phidata.com/tools/tavily
18. How to get help | People API - Google for Developers, 3月 3, 2025にアクセス、 https://developers.google.com/people/support
19. Contact DuckDuckGo | DuckDuckGo Help Pages, 3月 3, 2025にアクセス、 https://duckduckgo.com/duckduckgo-help-pages/company/contact-us/
20. Latest API topics - Tavily Community, 3月 3, 2025にアクセス、 https://community.tavily.com/c/api/8
21. tavily-ai/tavily-python: A python wrapper for Tavily search API - GitHub, 3月 3, 2025にアクセス、


いいなと思ったら応援しよう!