RAG技术深度解析：收藏这份开发者实战笔记，轻松掌握检索增强生成

RAG技术详解与大模型学习指南

最新推荐文章于 2025-11-26 15:49:07 发布

原创最新推荐文章于 2025-11-26 15:49:07 发布 · 944 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #算法 #产品经理 #学习 #程序员 #转行 #ai

目前自己的项目就是 RAG 类的，目前已经推向用户使用，所以先从 RAG 上，分享我自己的想法与经验，欢迎大家交流学习。写文章的目的是想践行费曼学习法，把逻辑尽可能说的简单，所以有些概念并不一定严谨，如果偏差，欢迎大家指正。

什么是RAG？

檢索增強生成（Retrieval-Augmented Generation, RAG），读起来非常绕口，我理解的核心就是就是基于让大模型在做生成的时候，能够基于你的知识生成答案，而不是那种通用的泛泛内容。

传统的RAG流程

从网络上找了一个通用的 RAG 的流程，简单总结一下，

1、就是将大模型需要的各种知识先进行向量化存储到数据库里面，

2、然后用户询问的时候从数据库找相近的知识，

3、检索出来之后进行重排序（rerank），获取最终的检索结果，将检索结果作为背景知识给到 LLM 生成大模型，获得基于你的背景知识的回复。

在这里插入图片描述

图片来源，请看附录

至于一般常说的 chunks、多路召回等，都是在这个基础上做的迭代与改进，至于为什么要改进，我在后续的文章中，再跟大家分享我遇到的坑。

解释几个核心的技术概念

什么是向量化

抛开技术实现原理不看，大家简单理解，就是他可以一定程度显示语义，可以识别语义的相似度。

为什么需要重排序（rerank）

既然向量化已经能够解决语义相似性了，为什么还需要 rerank 这一步？

因为向量化他只是一定程度的解决语义相似性问题，但是区分的并不是很好，rerank 它可以更加准确的区分语义，特别是看起来非常接近的概念。例如法律领域的买方、卖方，医学领域中各种病症的名词，这种差之毫厘，失之千里。这个就是 rerank 存在的意义，进一步识别语义。

LLM生成大模型是什么

其实这个就是我们常说的大模型。豆包、GPT 5 等都是说的这个大模型，所以前面的动作都是铺垫，都是准备内容，让这一步 LLM 大模型获取更加准确的知识，生成更加贴近我们场景的内容。

RAG应用场景

为什么 RAG 会这么火爆，因为他是打造自己的大模型应用的基础流程，只有把你的知识塞给大模型后，大模型才能生成你个性化的内容，不然大家为什么不直接使用豆包呢？

目前最常见的场景，就是搭建一个企业内部的知识问答工具，企业知识都是沉淀到企业内部的，必须要通过检索工具，给到大模型，大模型才能基于公司的场景进行专业回复。

如果想搭建自己的 Agent，RAG的理念/流程基本必不可少。例如你想搭建一个二次元/游戏领域聊天大模型，你就必须能够把二次元相关的最新信息给他才行（市面上的大模型基本都是按照轮次训练的，并不会自带最新的信息）。例如你问他梦幻西游 129 五开，

目前主力攻克的方向

幻觉问题

幻觉问题，很大一部分来源于大模型不知道他不知道，他以为他知道了，就开始跟你一顿胡吹，然后他还不知道他错了，这种在小众领域/企业内部专有名词上，表现的尤为严重，我们目前也是在主力解决这个问题。

目前市面上针对这种，相对成熟的方向是让 AI 自建知识图谱，然后通过图关系的形式，理解知识，但是坦白来说，例如 KAG（蚂蚁开源）、Light RAG，都无法做到开箱即用，还是需要我们自己不断尝试。

上下文长度问题

目前当我们给的背景知识长度太长之后，会导致回答显著变慢，影响用户体验。更致命问题，就是大模型会产生注意力缺失，就像别人给我们上了一整堂课之后，大模型自己会自己忽略掉很多细节。然后就觉得背景知识明明有，但是为什么大模型回答不出来的问题。

那么能不能给到大模型真正需要的知识？那么就需要我们在文档拆分、知识检索、知识重排的准确性很高才行。这里面每个又都是一个难点。如果后续大模型本身迭代，能够优化长上下文准确性，整个流程就简化很多了

多跳问题

多跳 (multi-hop)：问题需要把多个信息点结合起来，经过“推理链”才能得到答案。例如你问大模型，过去 5 年，哪个省份 GDP 增长幅度最大。这种场景就需要大模型自己检索过去 N 年的各个省份的数据，然后综合对比，获得增长幅度最大的结果。

这种场景在分析类 RAG 非常场景，目前主流的步骤是采取问题拆解、分别检索、综合获取最终答案，但是这种问题拆解难度很高。更加趋势类的做法是 Agentic RAG，采取类似 MCP 理念，让 AI 自己问题拆分、检索、分析，基于分析结果再继续拆分、检索……。

指定遵从问题

很多时候，我们要求大模型不要自己 YY，要参考我们的知识，但是很多时候，模型的遵从性并不好。甚至之前，我们要求按照 json 返回，模型都无法 100% 做到（最新的模型，结果格式的遵从性好很多了）

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述