NVIDIA NIM バーチャルヘルプディスク仕様書
1. システム概要
NVIDIA NIMエージェントは、LangGraphフレームワークとNVIDIA NIM、NVIDIA NeMo Retrieverなどの高度なAI技術を利用し、顧客からの複雑な問い合わせに対し、人間に近い応答を生成するバーチャルアシスタントを提供するシステムです。本システムは、構造化および非構造化データを効果的に処理し、顧客満足度を向上させることを目指しています。
2. システム機能
2.1 主機能
会話型バーチャルアシスタント
ユーザーインターフェースを通じてエージェントと対話し、複数ターンでの会話履歴を保持します。問い合わせ解決のプランニングと実行
LangGraphエージェントが、Llama 3.1 70B Instruct NIMのツール呼び出し機能を用い、複雑な問い合わせに対して適切な情報を取得・応答生成を行います。短期記憶・長期記憶の管理
繰り返し発生する質問や重要な過去の対話情報を活用し、より人間らしいインタラクションを提供します。会話要約と履歴保存
会話の要約を生成し、会話履歴を構造化データベースに保存することで、後から検索・参照可能とします。センチメント分析
顧客の満足度を分析し、エージェントのパフォーマンスを評価するためのインサイトを管理者に提供します。
2.2 補助機能
構造化および非構造化データの効率的な検索
構造化データ(例:顧客プロファイル、注文履歴)および非構造化データ(例:製品マニュアル、FAQ)を取り込み、必要な情報を素早く検索・取得します。データフライホイール
顧客フィードバックを基にモデルの精度と効率を改善し、継続的な学習を行います。
3. アーキテクチャ
3.1 システム構成
LangGraphフレームワーク:AIエージェントを制御し、問い合わせのプランニング・解決を行います。
NVIDIA NIMマイクロサービス:Llama 3.1などのLLMを活用し、必要な情報を取得し、応答生成に使用します。
データストレージ
構造化データ:Postgresデータベースを使用し、PandasAIを通じて問い合わせ処理を行います。
非構造化データ:NeMo Retrieverでチャンキング・埋め込み処理を行い、Milvusに保存します。
3.2 コンポーネント
構造化データレトリバー:ユーザーのクエリに基づきPostgresデータベースから関連データを取得します。
非構造化データレトリバー:製品マニュアルやFAQなどの非構造化データを処理し、迅速な検索を可能にします。
センチメント分析エージェント:顧客の会話における感情を分析し、顧客満足度を評価します。
4. 主な使用技術とツール
NVIDIA NIM推論マイクロサービス
エンベッドQA、Rerank Mistral 4B、Llama 3.1 70B Instructなどの推論モデル
データベースとストレージ
Postgres:構造化データの保存・検索
Milvus:非構造化データの検索
運用管理ツール
Helmチャートによるデプロイ管理
5. 運用および管理機能
会話履歴管理:すべての会話データを保存し、将来のクエリに使用します。
サマリー生成:各セッション終了時に要約を生成し、次回の問い合わせ対応に利用します。
管理者向けインサイト:顧客満足度の傾向をレポート化し、エージェントのパフォーマンスを改善します。
6. ハードウェアおよびソフトウェア要件
6.1 ハードウェア
推奨GPU:NVIDIA H100またはA100
メモリ要件:32GB以上
6.2 ソフトウェア
OS:Ubuntu 22.04
依存ソフトウェア
NVIDIA NIM推論マイクロサービス、Milvus、Postgres、Helm
7. サンプルユーザーシナリオ
注文キャンセルの問い合わせ
例:ユーザーが「GeForce RTX 4060 Tiの注文がキャンセルされた理由は?」と質問。エージェントの応答:構造化データから顧客の注文履歴を検索し、キャンセル理由を取得し、応答を生成します。
返品状況の確認
例:「GeForce RTX 4070 SUPERの返品状況は?」と質問。エージェントの応答:構造化データから返品状況を取得し、返答します。
到着時期の問い合わせ
例:「GeForce Abstraction Teeはいつ届きますか?」という質問。エージェントの応答:発送情報を参照し、到着予定日を提供します。
8. セキュリティとデータ保護
データ保護
顧客データの保存には暗号化を行い、不正アクセスから保護します。
アクセス制御
管理者と一般ユーザーでアクセス権を分け、管理者のみが履歴データやセンチメント分析結果にアクセス可能とします。
9. 継続的な改善
フィードバックループ
各応答に対する顧客のフィードバックを収集し、エージェントの応答精度を向上させます。
10. 補足
資料参照
サンプルデータセット(Data.zip)には、顧客プロファイル、注文履歴(構造化データ)および製品マニュアル、FAQ(非構造化データ)が含まれ、テストに使用可能です。