RAG
概要
RAG は Retrieval-Augmented Generation の略で、検索で取り出した外部文書を使って生成AIの回答を作る方法である。モデルの内部知識だけに頼らず、文書検索、ベクトル検索、キーワード検索、データベース、社内ナレッジなどを参照する。
背景
Lewis らの2020年の論文は、事前学習済みの生成モデルと、Wikipedia などの外部メモリを検索する仕組みを組み合わせる RAG を提案した。以後、企業の社内文書検索、カスタマーサポート、法務・医療・研究支援、コード検索などで広く使われるようになった。
RAG は、モデルの重みを更新しなくても知識を差し替えられる点、回答の根拠文書を示しやすい点で重要である。
シンギュラリティ文脈
RAG は、AIが外部知識を動的に取り込みながら作業する基盤である。長期的には、研究論文、実験ログ、コード、センサー情報、組織内知識を検索しながら推論するAIエージェントの中核になる。
一方で、RAG は知能そのものを無制限に高める魔法ではない。検索できない情報、誤った文書、古い文書、矛盾する文書、検索漏れがあると回答も壊れる。
使い方の注意
- 検索結果の品質が回答品質を大きく左右する。
- 引用文書が存在しても、モデルが文書内容を誤って要約することがある。
- ベクトル検索だけでは、固有名詞、数値、日付、否定条件に弱い場合がある。
- 機密文書をRAGに入れる場合は、アクセス権、ログ、データ保持、プロンプト注入対策が必要である。
関連項目
- ツール使用
- コンテキスト長
- エージェント
- モデル評価
- ローカルLLM