エージェンティックRAGとは~AIエージェントの発展とRAGの新境地
企業における生成AI活用では、情報の正確性が特に重視されています。そのため、生成AIを利用する場合、RAG(検索拡張生成)の導入が一般的となっています。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法の1つです。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれています。しかし、既存のRAGシステムには、いくつかの課題が存在し、大きく4つに分類されます。
1つ目は、RAGだけでは情報の正確性が担保できないことです。例えば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれます。この場合、CRMが最も信頼できる情報源となるはずですが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報を引用してしまう可能性があります。
2つ目は、ハルシネーションの問題です。生成AIの特徴である自然な文章生成能力は、時として正確さを損ねる原因にもなります。生成AIは、データの要約時に、情報を歪曲したり、存在しない事実を追加したりする傾向があるからです。RAG活用により、ハルシネーションの可能性は下がるとされていますが、完全にハルシネーションリスクを排除することは難しいのが現状となっています。
3つ目は、企業固有のコンテキストを理解できない点です。企業では、固有の用語や略語が頻繁に使用されていますが、RAGシステムは企業固有のコンテキストを持たないため、これらの用語をキーワードとして扱うか、さらには誤ったスペルとして補正してしまう可能性があります。
4つ目は、スケーラビリティの問題です。企業の情報システムには、テラバイトからペタバイト規模のデータが存在しています。数十億のファイルやドキュメントから構成される膨大なデータを、既存のRAGシステムで効率的に処理することは難しいのが現状です。検索時に関連性の高い文書を適切に抽出できなければ、生成AIは情報を正しく要約することができず、誤ったアウトプットを出力してしまう可能性が高まります。
これらの課題は、基本的なRAGシステムでは解決が困難といわれています。そこで注目されているのが、AIエージェントの仕組みを組み込んだ「エージェンティックRAG」です。
エージェンティックRAGは、AIエージェントをRAGパイプラインに組み込むことで、情報検索と生成の精度を向上させる手法です。このアプローチは2024年に入り、エージェントシステムの発展に伴い、大きな進展を見せています。エージェンティックRAGの最大の特徴は、AIエージェントの自律的な判断能力にあるといえます。AIエージェントは、LLM(大規模言語モデル)をベースに、メモリ機能、プランニング機能、そして外部ツールへのアクセス機能を備えています。これにより、単純な情報検索と生成を超えた、より高度な情報処理が可能となります。
代表的なAIエージェントの1つがReActと呼ばれるフレームワークです。ReActは「Reason(推論)+Act(行動)」の略で、AIエージェントがユーザーのクエリに対して以下の3つのステップで対応します。まず「Thought(思考)」でクエリの意図を理解し、次のアクションを決定します。次に「Action(行動)」で、決定したアクションを実行します。最後に「Observation(観察)」でアクションの結果を評価します。このプロセスを、タスク完了まで繰り返します。
エージェンティックRAGのアーキテクチャには、シングルエージェントとマルチエージェントの2つのパターンが存在します。シンプルな構成のシングルエージェントは、複数の情報ソースから最適なものを選択するルーターとして機能します。一方、マルチエージェントでは、情報検索を統括するマスターエージェントの下に、社内データ、メール、チャット、ウェブ検索など、それぞれの情報ソースに特化したエージェントを配置します。このようなアーキテクチャにより、エージェンティックRAGは従来のRAGシステムにない柔軟性と機能性を実現できます。クエリの意図を理解し、適切な情報ソースを選択することが可能になります。また、必要に応じて複数のステップに分解し、各ステップで最適なツールを使用することで、より正確で信頼性の高い回答を生成できるようにもなります。
現在では、エージェンティックRAGに特化したスタートアップも登場しています。VentureBeatの報道(2024年10月8日)によると、スタートアップのVectorizeが360万ドルのシード資金を調達し、エージェンティックRAGプラットフォームの一般提供を開始しています。同社のプラットフォームは、リアルタイムのデータ処理に対応したエージェンティックRAGの実装を可能にするといいます。
Vectorizeが焦点を当てるのは、データエンジニアリングの自動化です。同社のクリス・ラティマー氏(CEO兼共同創業者)はVentureBeatの取材の中で、「生成AIプロジェクトの多くが、ベクトルデータベースに格納される情報のコンテキスト不足により、ハルシネーションや誤った解釈に悩まされている。」と指摘しています。Vectorizeは、非構造化データの取り込みから最適化まで、エンタープライズRAGのデータパイプラインを自動構築する機能を提供することで、この課題の解決を目指しています。すでに同社のエージェンティックRAG機能は、AI推論チップ開発のGroqによって実践投入されています。Groqは、Vectorizeのデータパイプラインを活用したAIサポートエージェントを開発しました。このエージェントは、過去に類似の質問があった場合、その情報を参照しつつ、人間を介さずに問題を解決できるといわれています。
一方で、エージェントが解決できない問題が発生した場合は、人間のオペレーターに引き継ぐ仕組みも備えています。VectorizeのRAGプラットフォームでは、企業のデータ鮮度に合わせて、ベクトルデータベースの更新頻度を柔軟に設定することも可能です。週1回の更新、リアルタイムの更新など、ニーズに応じた設定ができます。ラティマーCEOは「古いデータは古い意思決定につながる」と指摘し、データ更新のタイミングが重要であることを強調しています。Vectorizeのプラットフォームは、ベクトルデータベースやベクトル埋め込み技術そのものを提供するものではありません。代わりに、Pinecone、DataStax、Couchbase、Elasticなどの既存のベクトルデータベースと接続し、非構造化データの取り込みと最適化を担います。また、OpenAIのadaやVoyage AIなど、さまざまなベクトル埋め込みモデルを使用できる柔軟性も備えています。
AIモデル自体の進化速度は若干鈍化しているといわれていますが、AIエージェントシステムの発展余地はまだ大きいと考えられます。AIエージェントの進化に伴い、エージェンティックRAGがどのように発展していくのか、今後の注目ポイントとなることは間違いありません。
AIが普及し2年余りが経ちましたが、ハルシネーションを含め、手放しに信頼できる存在にはなっていません。一般の人にも便利のいいツールという印象は広がり、無料利用できる範疇で利用する人も増えてきています。ただ、高い信頼性が必要な場面での利用には躊躇している人もいるのが現状です。AIの発展には信頼性の獲得が不可欠であり、人間のパートナーになるにはまだ時間はかかります。しかし、様々なアプローチでAIの信頼性を高めようとする研究・開発が進んでいる現状を知ると、2025年のAI分野がどのように発展するのか期待せずにはいられません。