RAG原理是什么？

原创

已于 2025-09-10 17:03:31 修改 · 374 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-09-10 16:40:04 首次发布

RAG（Retrieval-Augmented Generation，检索增强生成）的原理。

我会用一个简单的比喻开始，然后深入技术细节，最后总结其优势和适用场景。

一、核心比喻：开卷考试

想象一下两种考试方式：

闭卷考试（传统大语言模型LLM）：模型只能凭借记忆（即其训练时学习到的参数化知识）来回答问题。如果问题超出了它的记忆范围，或者信息是训练时未包含的最新信息，它就可能答错或“胡编乱造”（产生幻觉）。
开卷考试（RAG）：允许模型在答题前先查阅相关的参考书（外部知识库）。它先根据问题找到最相关的段落，然后结合这些段落和自己的知识组织语言，给出答案。

RAG就是让AI模型从“闭卷考试”变成“开卷考试”的技术。

二、工作原理：分步详解

RAG的工作流程通常分为三个核心阶段：检索（Retrieval）、增强（Augmentation） 和 生成（Generation）。

第1步：检索（Retrieval） - “查找资料”

目标：根据用户的问题（Query），从一个庞大的外部知识库中快速找到最相关的信息片段（Chunks）。
如何实现：
1. 知识库准备：首先，需要有一个知识库。这可以是公司内部文档、产品手册、最新的网络文章、法律条文等任何文本数据。这些文本会被分割成更小的片段（例如，一段话或几百个字符）。
2. 向量化（Embedding）：使用一个嵌入模型（Embeddin

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。