初步了解RAG：检索增强生成技术

RAG：解决大模型问题的检索增强技术

原创已于 2025-03-20 13:35:34 修改 · 504 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #DeepSeek #自然语言处理

于 2025-03-20 13:31:32 首次发布

AI大模型专栏收录该内容

16 篇文章

订阅专栏

在大语言模型（LLM）盛行的时代，RAG（Retrieval Augmented Generation，检索增强生成）的技术频繁崭露头角，让我们一同了解下什么是RAG 技术？

一、RAG 是什么？

RAG 是检索技术与 LLM 提示的巧妙结合。想象一下，当我们向 LLM 提出一个问题（answer）时，RAG 会如同一位高效的信息调研员，从各种数据源中检索相关信息，并将这些检索到的信息与问题一同注入到 LLM 提示里，最后由 LLM 给出答案。这种方式打破了传统 LLM 仅依赖自身训练数据的局限，为模型的回答引入了更丰富、多元的信息。

二、RAG 解决的关键问题

1、知识局限性

目前主流的大模型，如 ChatGPT、文心一言、通义千问等，其知识完全来源于训练数据。而这些训练集大多构建于网络公开数据，对于实时性信息、非公开数据或离线数据，模型往往无能为力，导致在某些场景下知识储备不足。RAG 通过从外部数据源检索信息，有效地弥补了这一缺陷，让模型能够获取更全面、更及时的知识。

2、幻觉问题

所有 AI 模型基于数学概率的底层原理，使得其输出本质上是数值运算的结果。大模型也难以避免出现 “一本正经地胡说八道” 的情况，特别是在其不熟悉的领域或知识欠缺的场景。并且，识别这种幻觉问题对使用者自身知识储备要求较高。RAG 借助外部检索的真实信息，为模型提供可靠的参考依据，减少幻觉问题的出现。

3、数据安全性

对于企业而言，数据安全是重中之重。没有企业愿意冒险将私域数据上传至第三方平台进行训练，以免造成数据泄露。RAG 可以在企业内部搭建外部知识库，利用企业自有数据进行检索，在保障数据安全的前提下，提升模型对企业特定领域知识的处理能力。