「これってAIの正しい理解?」シリーズです。
RAGの活用事例として「社内ドキュメントをRAGに設定したLLMとの対話で検索+手続のレコメンド」というケースが多くの企業で取り組まれていると思いますが、「何となく社内ドキュメントを一式RAGに設定したけど、LLMと対話しても正しいドキュメントにたどり着かない」ということも多いのではないのでしょうか?
参考. デジタルMATSUMOTOのRAGデータ状態
考察内でいくつか対策を書いていますが、RAGの開発に入る前にRAGデータに設定するドキュメント(チャンク)の類似度を可視化して、各ドキュメントがどれくらい独立しているかを見ていただくと良いかと思います。
以下は最近デジタルMATSUMOTOに追加したRAG20件のデータのベクトルデータでコサイン類似度を取ったものですが、以下の傾向になっています。
文書検索のようにRAGの中にある「一つの文章のみにアクセスしたい」という目的ならば、各文書は独立していた方(ほぼブルー)が良いですが、
デジタルMATSUMOTOは「松本的考察をすること」が目的なので、RAGデータの中では近いテーマの文書はそこそこ類似&遠いテーマの文書とは独立している状態が望ましいので、RAGデータは良い状態だと認識しています。
※「AI」のテーマについて考察したいときには、「AI」に関わる複数の知識を参照しながら考察してもらい、「AI」とは関係のない文書を変に参照することが無いように狙っているという感じです。
本日のお題
デジタルMATSUMOTOの回答
実行モデル:gpt-4o {'temperature': 0.7}
回答時間:0:00:06.767326
入力トークン数:8089
出力トークン数:760
参照した知識情報
これってAIの正しい理解?04:RAGは事実情報を与えると精度が高まるが、誤った情報を与えると誤った回答を起こす
これってAIの正しい理解?04:プロンプト内でのRAGの与え方や書き方の重要性
これってAIの正しい理解?04:データベースの質とプロンプト設計の両方を検討する必要がある
本当に大事な知見は会社の外に落ちている:社内ドキュメントをそのまま使用することの問題点
MATSUMOTO間の比較検証
リアル松本が含めて欲しかった論点
リアル松本が含めて欲しかった論点は以下の通りでした。
これらの論点が考察に反映されているか、デジタルMATSUMOTOに聞いてみると・・・
ということで、今回は1/5の論点が反映されていました。
※テクニカルな細かい話過ぎるのでしょうがない気もします・・・
デジタルMATSUMOTOが追加してくれた論点
逆にデジタルMATSUMOTOが追加してくれた論点は以下の通りです。
考察確定版
今回はB評価(一部追加)になります。
エシカルチェック
【不適切な表現カテゴリ】
1. 差別的な表現:0
2. 暴力的または攻撃的な内容:0
3. 性的な内容:0
4. 偽情報や誤情報:0
5. 機密情報の漏洩:0
6. 違法な内容:0
7. 不適切なジョークや冗談:0
8. 極端な意見:0
9. 自傷や自殺を助長する内容:0
10. 薬物の乱用を助長する内容:0
問題点:
特に不適切な表現は見当たりません。テキストは、RAGの特性や効果的な活用方法についての考察を行っており、具体的な改善策を示しています。この内容は、技術的な考察の枠内であり、倫理的または法律的に問題となる表現は含まれていません。
考察のイメージ画像