目前自己的项目就是 RAG 类的,目前已经推向用户使用,所以先从 RAG 上,分享我自己的想法与经验,欢迎大家交流学习。写文章的目的是想践行费曼学习法,把逻辑尽可能说的简单,所以有些概念并不一定严谨,如果偏差,欢迎大家指正。
什么是RAG?
檢索增強生成(Retrieval-Augmented Generation, RAG),读起来非常绕口,我理解的核心就是就是基于让大模型在做生成的时候,能够基于你的知识生成答案,而不是那种通用的泛泛内容。
传统的RAG流程
从网络上找了一个通用的 RAG 的流程,简单总结一下,
1、就是将大模型需要的各种知识先进行向量化存储到数据库里面,
2、然后用户询问的时候从数据库找相近的知识,
3、检索出来之后进行重排序(rerank),获取最终的检索结果,将检索结果作为背景知识给到 LLM 生成大模型,获得基于你的背景知识的回复。

图片来源,请看附录
至于一般常说的 chunks、多路召回等,都是在这个基础上做的迭代与改进,至于为什么要改进,我在后续的文章中,再跟大家分享我遇到的坑。
解释几个核心的技术概念
什么是向量化
抛开技术实现原理不看,大家简单理解,就是他可以一定程度显示语义,可以识别语义的相似度。
为什么需要重排序(rerank)
既然向量化已经能够解决语义相似性了,为什么还需要 rerank 这一步?
因为向量化他只是一定程度的解决语义相似性问题,但是区分的并不是很好,rerank 它可以更加准确的区分语义,特别是看起来非常接近的概念。例如法律领域的买方、卖方,医学领域中各种 病症的名词,这种差之毫厘,失之千里。 这个就是 rerank 存在的意义,进一步识别语义。
LLM生成大模型是什么
其实这个就是我们常说的大模型。豆包、GPT 5 等都是说的这个大模型,所以前面的动作都是铺垫,都是准备内容,让这一步 LLM 大模型获取更加准确的知识,生成更加贴近我们场景的内容。
RAG应用场景
为什么 RAG 会这么火爆,因为他是打造自己的大模型应用的基础流程,只有把你的知识塞给大模型后,大模型才能生成你个性化的内容,不然大家为什么不直接使用豆包呢?
目前最常见的场景,就是搭建一个企业内部的知识问答工具,企业知识都是沉淀到企业内部的,必须要通过检索工具,给到大模型,大模型才能基于公司的场景进行专业回复。
如果想搭建自己的 Agent,RAG的理念/流程基本必不可少。例如你想搭建一个二次元/游戏领域聊天大模型,你就必须能够把二次元相关的最新信息给他才行(市面上的大模型基本都是按照轮次训练的,并不会自带最新的信息)。例如你问他梦幻西游 129 五开,
目前主力攻克的方向
幻觉问题
幻觉问题,很大一部分来源于大模型不知道他不知道,他以为他知道了,就开始跟你一顿胡吹,然后他还不知道他错了,这种在小众领域/企业内部专有名词上,表现的尤为严重,我们目前也是在主力解决这个问题。
目前市面上针对这种,相对成熟的方向是让 AI 自建知识图谱,然后通过图关系的形式,理解知识,但是坦白来说,例如 KAG(蚂蚁开源)、Light RAG,都无法做到开箱即用,还是需要我们自己不断尝试。
上下文长度问题
目前当我们给的背景知识长度太长之后,会导致回答显著变慢,影响用户体验。更致命问题,就是大模型会产生注意力缺失,就像别人给我们上了一整堂课之后,大模型自己会自己忽略掉很多细节。然后就觉得背景知识明明有,但是为什么大模型回答不出来的问题。
那么能不能给到大模型真正需要的知识? 那么就需要我们在文档拆分、知识检索、知识重排的准确性很高才行。这里面每个又都是一个难点。如果后续大模型本身迭代,能够优化长上下文准确性,整个流程就简化很多了
多跳问题
多跳 (multi-hop):问题需要把多个信息点结合起来,经过“推理链”才能得到答案。 例如你问大模型,过去 5 年,哪个省份 GDP 增长幅度最大。这种场景就需要大模型自己检索过去 N 年的各个省份的数据,然后综合对比,获得增长幅度最大的结果。
这种场景在分析类 RAG 非常场景,目前主流的步骤是采取 问题拆解、分别检索、综合获取最终答案,但是这种问题拆解难度很高。更加趋势类的做法是 Agentic RAG,采取类似 MCP 理念,让 AI 自己问题拆分、检索、分析,基于分析结果再继续拆分、检索……。
指定遵从问题
很多时候,我们要求大模型不要自己 YY,要参考我们的知识,但是很多时候,模型的遵从性并不好。甚至之前,我们要求按照 json 返回,模型都无法 100% 做到(最新的模型,结果格式的遵从性好很多了)
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

RAG技术详解与大模型学习指南
1400

被折叠的 条评论
为什么被折叠?



