テクノロジ系AI・新技術

RAG（Retrieval-Augmented Generation）とは？

読み方: らぐ

1行定義

外部データベースから関連情報を検索（Retrieval）し、その情報をLLMの入力に加えて回答の精度・信頼性を高める技術

詳細解説

RAG（Retrieval-Augmented Generation: 検索拡張生成）は、大規模言語モデル（LLM）の出力精度を高めるアーキテクチャで、ユーザーの質問に対して①外部の信頼できるデータベース・文書から関連情報を検索（Retrieve）し②その検索結果をLLMの入力プロンプトに含めた上で③LLMが検索情報に基づいた回答を生成（Generate）する仕組みです。RAGが解決する主な問題はハルシネーション（事実と異なる情報の生成）と知識カットオフ（LLMの学習データの時点以降の最新情報を知らない問題）です。RAGの技術的な流れは次の通りです。文書のベクトル化（Embedding）：ドキュメントを数値ベクトルに変換してベクトルデータベース（Pinecone・Chroma・pgvector等）に格納。検索（Retrieval）：質問文のベクトルと類似度（コサイン類似度等）が高い文書を検索。拡張生成（Generation）：検索文書＋質問をLLMに入力して回答生成。RAGの活用例は社内ドキュメント検索AI・カスタマーサポートbot・法律・医療情報の正確な回答システムです。ファインチューニング（モデル自体を追加学習）との違いはRAGはモデルを変更せず外部知識を参照する点で、最新情報への対応やコスト面で有利です。ITパスポートでは「RAGの目的と仕組み」「ハルシネーション低減との関係」「ベクトル検索の概念」が出題対象です。

ITパスポートでの出題ポイント

1外部DBを検索してLLMの入力に加え回答精度を向上
2ハルシネーション低減と知識カットオフ問題の解決が主目的
3ベクトルDB（Pinecone等）でセマンティック類似検索を実現
4ファインチューニングとの違い：モデル変更なし・最新情報対応が容易

RAG（Retrieval-Augmented Generation）とは？

詳細解説

ITパスポートでの出題ポイント

関連用語

「RAG（Retrieval-Augmented Generation）」の過去問を解いて理解を定着