RAG

RAG は Retrieval-Augmented Generation の略で、検索で取り出した外部文書を使って生成AIの回答を作る方法である。モデルの内部知識だけに頼らず、文書検索、ベクトル検索、キーワード検索、データベース、社内ナレッジなどを参照する。

Lewis らの2020年の論文は、事前学習済みの生成モデルと、Wikipedia などの外部メモリを検索する仕組みを組み合わせる RAG を提案した。以後、企業の社内文書検索、カスタマーサポート、法務・医療・研究支援、コード検索などで広く使われるようになった。

RAG は、モデルの重みを更新しなくても知識を差し替えられる点、回答の根拠文書を示しやすい点で重要である。

RAG は、AIが外部知識を動的に取り込みながら作業する基盤である。長期的には、研究論文、実験ログ、コード、センサー情報、組織内知識を検索しながら推論するAIエージェントの中核になる。

一方で、RAG は知能そのものを無制限に高める魔法ではない。検索できない情報、誤った文書、古い文書、矛盾する文書、検索漏れがあると回答も壊れる。

項目