RAG是个啥？一文速通RAG核心知识【小白收藏版】

最新推荐文章于 2026-01-08 15:22:05 发布

原创最新推荐文章于 2026-01-08 15:22:05 发布 · 890 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#java #python #transformer #大模型 #大模型学习 #RAG #ai大模型

1、为什么需要RAG？

先给程序员和AI小白举个扎心的例子：让主流大模型判断13.8和13.11哪个更大，它大概率会一本正经地告诉你“13.11更大”。这种明显违背基础数学常识的错误回答，正是大模型高频出现的“幻觉”问题——看似逻辑通顺，实则完全脱离事实

在这里插入图片描述

其实大模型并非“全知全能”，这种“胡言乱语”的幻觉问题，核心可归结为两大原因，搞懂这两点才能明白RAG的价值：

模型本身的机制缺陷：大模型的核心是基于统计概率预测下一个词，而非真正“理解”事实并查询验证。受训练数据覆盖度、参数学习精度的限制，很容易生成逻辑混乱或与事实相悖的内容。
训练数据的先天不足：大模型的所有回答都依赖于训练阶段学到的知识，但这些知识存在天然短板：
- 知识过时：训练数据有时间截止点，无法获取实时更新的信息（比如2025年的新政策、刚发布的技术文档）；
- 知识边界有限：垂直领域的专业知识（如医疗病历解读、企业内部文档）、私有数据，大模型根本没接触过；
- 知识存在偏差：训练数据中可能混杂错误信息，导致模型学到“错误知识”并输出。

而解决大模型幻觉、提升回答可靠性的关键技术之一，就是我们今天要讲的检索增强生成（RAG）。对于想入门大模型应用开发的同学来说，RAG是必备基础技能，建议优先掌握！

2、什么是RAG？

RAG（Retieval-Augmented Generation，检索增强生成）：建立一个外部数据库，将大模型不知道的知识存储在外部数据库中，供大模型进行检索调用，用于提高大模型回答的质量。

用户提问后，根据用户的问题到外部数据库中检索得到上下文（context），得到的上下文与用户的问题整合后，作为Prompt提示词送入大模型供其搜索答案。

在这里插入图片描述

3、RAG三大好处

减少大模型的幻觉；
为大模型提供最新的知识，帮助大模型生成质量更高的答案；
相较于模型微调，效率更高、成本更低。

4、RAG基础概念扫盲

向量嵌入（Vector Embeddings）：将复杂数据（如：图像、文本、音频等）转换为数值向量的过程和结果。向量通常是高维的数字数组，向量中可以体现数据间的语义信息，语义相近的数据向量值接近，在向量空间中距离更近。

例如，给定三个词Cat、kitty、Apple，将这三个词转换为向量，可以看到，语义相近的Cat、kitty向量值比较接近，而Apple与其他词值相差较大，体现在向量空间中，语义相近的对象距离更近。

在这里插入图片描述

图源@Jim大表哥-AI讲解

嵌入模型（Embedding Model）：将复杂数据（如：词语、句子或文档）等转换为向量的技术。

在这里插入图片描述

向量数据库（Vector Database）：用于存储和检索高维向量数据的数据库，处理与相似性搜索相关的任务，通过语义来搜索。可作为AI的长期记忆库。

向量数据库与传统数据库区别如下：

	向量数据库	关系数据库
数据类型	存储高维向量数据	结构化数据
查询方式	相似性搜索	精确匹配和范围查询
应用场景	AI相关	管理系统等
代表数据库	Milvus、Elasticsearch等	MySQL、Oracle等

相似性搜索（Similarity Search）：利用向量空间中对象间的接近程度来识别和检索相似的对象，这种基于相似度检索的方法，就是相似性搜索。

在这里插入图片描述

RAG工作流程详解

总体流程可分为四步；

构建外部知识库：针对知识库中各类格式的文档（如：PDF、Word等）进行处理。对知识库中的文档进行分割（Split），将分割后的文本块（Text Chunk）利用嵌入模型转为嵌入向量，存储到向量数据库中。

文档分割的质量决定了检索的准确性和生成模型的效果。
检索（Retreive）: 将用户输入的问题利用嵌入模型转换为向量，到向量数据库中进行相似性搜索，找到相似度最大的向量，输出为上下文（Context）。
增强（Augment）：上下文与用户问题结合作为提示词（Prompt）送入大模型。
生成（Generation）：大模型根据提示词（Prompt）生成回答，生成的回答返回给用户。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】