テクノロジ系AI・新技術
RAG(Retrieval-Augmented Generation)とは?
読み方: らぐ
1行定義
外部データベースから関連情報を検索(Retrieval)し、その情報をLLMの入力に加えて回答の精度・信頼性を高める技術
詳細解説
RAG(Retrieval-Augmented Generation: 検索拡張生成)は、大規模言語モデル(LLM)の出力精度を高めるアーキテクチャで、ユーザーの質問に対して①外部の信頼できるデータベース・文書から関連情報を検索(Retrieve)し②その検索結果をLLMの入力プロンプトに含めた上で③LLMが検索情報に基づいた回答を生成(Generate)する仕組みです。RAGが解決する主な問題はハルシネーション(事実と異なる情報の生成)と知識カットオフ(LLMの学習データの時点以降の最新情報を知らない問題)です。RAGの技術的な流れは次の通りです。文書のベクトル化(Embedding):ドキュメントを数値ベクトルに変換してベクトルデータベース(Pinecone・Chroma・pgvector等)に格納。検索(Retrieval):質問文のベクトルと類似度(コサイン類似度等)が高い文書を検索。拡張生成(Generation):検索文書+質問をLLMに入力して回答生成。RAGの活用例は社内ドキュメント検索AI・カスタマーサポートbot・法律・医療情報の正確な回答システムです。ファインチューニング(モデル自体を追加学習)との違いはRAGはモデルを変更せず外部知識を参照する点で、最新情報への対応やコスト面で有利です。ITパスポートでは「RAGの目的と仕組み」「ハルシネーション低減との関係」「ベクトル検索の概念」が出題対象です。
ITパスポートでの出題ポイント
- 1外部DBを検索してLLMの入力に加え回答精度を向上
- 2ハルシネーション低減と知識カットオフ問題の解決が主目的
- 3ベクトルDB(Pinecone等)でセマンティック類似検索を実現
- 4ファインチューニングとの違い:モデル変更なし・最新情報対応が容易
関連用語
シラバス 6.5 準拠 / 最終更新: 2026-05-25