RAG for Agentプロセスという考え方

マルチステップエージェントの安定化について

AIでマルチステップエージェントを作る際、安定した挙動にすることが難しいという話をよく耳にします。多くの人はRAG(Retrieval-Augmented Generation)に知識を入れていますが、プロセス情報を先に入れたRAGを作る方が良いのではないかというコンセプトについて考えてみました。

プロセス情報を先にRAGに入れる

例えば、XXしたいときの手順を以下のように構成します:

  1. 調査: どこを調べるべきか

  2. 考慮: どう考えるべきか

  3. ツールの使用: どのツールを使うべきか

  4. 保存: 結果をどう保存するか

このように、エージェントのプロセス情報をRAGとして用意しておくことで、エージェントの処理が安定し、結果的にエージェントの回答も安定します。

このプロセス処理の安定性がRAGで保証されると、AIエージェントが「印刷する」みたいな、自分でできないタスクや、処理待ちタスク、前処理省略して詰むようなトラブルを回避できる

知識情報の適用

いきなり知識情報をAIに渡しても、それをAIが適切に使えるとは限りません。そのため、まずRAGで「TPOに応じたAI向けの業務マニュアル」をAIに提供すると良いです。

実装のメリット

このアプローチを実装することで、AIを拡張する際にシナリオやfunction callingをハードコードする必要が減ります。結果的に、エージェントの柔軟性と適応性が向上するでしょう。

このような視点でRAGの設計を見直すことは、より安定したAIエージェントの構築に寄与するのではないかと考えています。

いただいたサポートは、コロナでオフィスいけてないので、コロナあけにnoteチームにピザおごったり、サービス設計の参考書籍代にします。