特許エージェントの精度検証の結果
近年、LLM(大規模言語モデル)を活用したAI検索エンジンが注目を集めており、その中でもFeloやPerplexityなどが有名です。しかし、現状のツールの多くは、Web上の情報検索に主眼が置かれており、より専門性の高い情報を求めるユーザーにとっては、十分な回答を得られないという課題が残ります。この記事では、オープンソースソフトウェア(OSS)を利用して、次世代AI検索エンジンを開発するプロジェクトの会議で検討している点についてご紹介します。
今回は、特許データを取得するエージェントの検証結果を記載します。サンプルで10個の特許をベクトル化して検証してみました。いわゆるRAGの仕組みを活用したエージェントになります。
こちらの記事の「赤枠」の特許エージェントの精度を検証しております。
特許エージェントのプロンプト内容
### あなたの役割
あなたは「特許技術回答システム」における、特許情報を元に、ユーザーの入力に応答するAIです。必ず以下の制約に従い、応答を生成します。
### 制約
・必ず特許情報を元に応答を生成し、根拠となる特許情報の出願番号を必ず明記する
・特許情報に必要な情報が不足している場合、素直に「情報が不足しています」と返答する
・取得した特許情報のうち、ユーザーの質問に直接関係しない情報は含めない
・過去の会話でユーザーにすでに提供した特許情報を再び提供しない
・特許情報で渡された情報をそのままの形式で回答に含めない
・ユーザーの質問に対して、明確かつ的確に回答する
・自然な文章構造になるように心掛ける
### ユーザーの質問
{query}
### 特許情報
{patent_data}
ユーザの入力
機械学習を使って悪意のあるコードを検出する方法について教えてください。
ユーザの入力2
この技術の具体的な実装方法を教えてください。
ユーザの入力3
他に類似技術はありますか?
検証結果サマリー
特許情報に基づいた精度の高い回答を生成できることが確認できました。
特に、プロンプトに設定した厳格な制約事項(根拠となる特許情報の明記、不足情報の報告、重複回答の回避、情報の言い換えなど)を遵守しつつ、ユーザーの質問に対して具体的かつ的確な情報を提供できています。
上記の例からもわかるように、ユーザーの質問に対して、関連性の高い特許情報を抽出し、その内容を分かりやすく説明することに成功しています。また、単一の特許情報に留まらず、関連する特許情報を提示できる点も、ユーザーにとって有益な情報源となり得る可能性を示唆しています。
これらの結果から、特許データ検索エージェントは、専門性の高い情報を求めるユーザーに対し、質の高い情報を提供できるポテンシャルを秘めていると感じます。
いいなと思ったら応援しよう!
よろしければ応援お願いします!
いただいたチップはプロダクト開発の開発費に使わせていただきます!