生成AI RAGとは？

2025年2月22日 00:18

RAG（Retrieval-Augmented Generation）は、生成AIが外部データを検索して回答を生成する技術です。通常の生成AI（LLM）は事前に学習したデータのみをもとに応答しますが、RAGはリアルタイムで検索した情報を組み合わせて、より正確で最新の回答を提供できます。

出来ること（特徴とメリット）

❶最新情報の活用

・通常の生成AIは学習時点の情報しか知らないが、RAGは最新データを検索して回答可能。

例
ニュースや法律の変更など、常に最新情報が必要な分野で活躍。

❷企業データの活用

・社内文書・FAQ・データベースなど、特定の情報を活用して回答が可能。

例
カスタマーサポート、社内ヘルプデスク、ナレッジベースの検索など。

❸精度向上と誤情報の削減

・検索した信頼できる情報を活用し、より正確な回答を生成。

例
医療や金融など、誤った情報が許されない分野での利用。

❹コスト削減

・大規模なモデルを再学習しなくても、外部データを組み合わせることで最新の知識を得られる。

LangChainとLangGraphによるRAG・AIエージェント［実践］入門 (エンジニア選書) ↓

使い方（基本の流れ）

❶データの準備

・FAQ、PDF、ウェブサイト、データベースなど、参照したい情報を整理する。

❷RAG対応のAIツールを選ぶ

例
LangChain（Pythonライブラリ）、LlamaIndex、Microsoft Azure OpenAI、Google Vertex AIなど。

❸情報検索の設定

・どのデータソースを使うか決め、検索エンジンやベクトルデータベース（例：FAISS、Pinecone）を設定する。

❹生成AIと組み合わせる

・OpenAI GPT-4、Claude、Geminiなどの大規模言語モデル（LLM）と統合する。

❺テストと改善

・正しく情報を取得できているか確認し、検索アルゴリズムやプロンプトを調整する。

LLMのファインチューニングとRAG: チャットボット開発による実践 ↓

サンプルコード（Python + LangChain）

以下は、RAGを使ってPDFから情報を検索し、GPT-4で回答を生成する例です。

from langchain.document_loaders import PyPDFLoader
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

# PDFを読み込む
loader = PyPDFLoader("example.pdf")
documents = loader.load()

# ベクトルデータベースを作成
embeddings = OpenAIEmbeddings()
vectorstore = FAISS.from_documents(documents, embeddings)

# RAGによる質問応答システム
qa = RetrievalQA.from_chain_type(llm=ChatOpenAI(), retriever=vectorstore.as_retriever())

# 質問をする
query = "このPDFの主要なポイントを教えて？"
response = qa.run(query)
print(response)

例題（実際の活用例）

❶カスタマーサポート（FAQ検索）

質問
「製品Aの保証期間は？」

通常のAI
「一般的に保証期間は1年です。」（正しいとは限らない）

RAG
社内FAQから検索 → 「製品Aの保証期間は2年間です。」（正確な回答）

❷社内ヘルプデスク

質問
「今月の経費精算の締切は？」

RAG
社内ポータルの最新情報を検索 → 「2025年2月25日が締切です。」

❸法律・規制情報の検索

質問
「2025年の税制改正のポイントは？」

RAG
政府の公式サイトを検索し、最新の税制情報を要約。

世界一やさしいRAG構築入門 ── Azure OpenAI Serviceで実現する賢いAIチャットボット ↓

価格（導入コスト）

❶無料で試せるもの
・OpenAIのAPI + Pinecone（無料枠あり）
・LangChain（オープンソース、無料）

❷有料サービス（目安）

注意点（導入前のポイント）

❶データの準備が重要
・検索対象のデータが古いと、RAGの回答も古くなる。
❷適切な検索設定が必要
・関係ない情報を引っ張ってこないように、フィルタリングや検索精度の調整が必要。
❸コスト管理に注意
・APIの呼び出し回数が多いと料金が高額になる可能性があるため、適切に管理する。
❹個人情報・機密情報の取り扱い
・社内情報を使う場合は、アクセス制限やデータ保護対策を忘れずに。

まとめ（初心者向けポイント）

✅ RAGは生成AIに検索機能を加えた技術で、最新＆正確な回答が可能
✅ 企業のFAQ、社内データ検索、最新情報取得などに活用できる
✅ Python（LangChain）を使うと手軽に試せる
✅ 無料で試せるツールもあるので、まずは簡単なデータで試してみると良い

まずは、簡単なFAQやPDFデータを使ってRAGの動作を試してみるのがおすすめです！