作为一个在 AI 领域摸爬滚打多年的研究者,我见证了大模型从 GPT-1 到 GPT-4 ,从几亿参数到千亿参数的飞跃。但越是深入研究,越感觉到一个残酷的现实:再强大的大模型,也有自己的知识边界。
之前跟一位朋友聊天,他抱怨说自己公司刚上线的 AI 客服总是胡说八道——明明问的是最新的产品信息,AI 却回答着几个月前的老政策。听到这里,我不禁想起了自己去年遇到的一个“尴尬事件”。
01
一次“翻车”引发的思考
那是在一次内部演示会议上,我演示了一个基于 GPT-4o 的智能问答系统。一位与会者问道:“GPT-4o 有什么新功能?”系统自信满满地回答了一大段,但仔细一听,说的好像还是 ChatGPT 时代的特性。
那一刻,台下传来了善意的笑声,而我的脸瞬间一红。这就像一个博学的教授,在讲台上滔滔不绝地讲着十年前的教科书内容,却对昨天发布的最新研究一无所知。
这提醒了我们:是否过度迷信了大模型的全知全能?
02
大模型的“阿喀琉斯之踵”
这让我想起古希腊神话中的阿喀琉斯。这位英雄刀枪不入,但脚踝却是他的致命弱点。大模型也是如此——它们在语言理解和生成方面堪称完美,但知识更新就是它们的“脚踝”。
可能使用过大模型的人都知道,当大模型遇到不知道的问题时,它们很少会诚实地说“我不知道”。相反,它们不愿承认自己的无知,硬是编造出看似合理但实际错误的答案。
我曾经测试过一个医疗 AI,问它一种 2024 年新发现的罕见疾病的治疗方法,大模型能够煞有介事地给出了一套“标准治疗方案”——而这种疾病根本不在它的训练数据,所谓的标准治疗方案,也只是统计结果上最类似疾病的治疗方案的抄袭。
记得有一个项目,和一位医生沟通,他告诉我:“作为医生,我们从来不会仅凭记忆给病人下诊断。即使是最有经验的专家,也会查阅最新的医学文献、参考同行的病例报告。这不是无知,而是负责任。”
对啊。为什么我们要求 AI 做到人类都做不到的事情——仅凭“记忆”就能掌握全世界的最新知识?
从这点出发,那么:能否让 AI 也学会查资料?这就是 RAG(检索增强生成)的核心思想。
03
给 AI 装上“实时大脑”
RAG 不是什么高深莫测的概念。我喜欢用这样一个比喻来解释它:
假如你是一位律师,正在为客户进行辩护。你不可能记住所有的法条和判例,这是事实,但你知道去哪里查找你要的法条和判例,这是你的专业素养,然后结合你的专业知识,为客户制定最佳的辩护策略。
RAG 就是让 AI 具备了这样的能力——既保持强大的“理解和表达”能力,又能随时调取最新、最准确的信息。
在我写这本书的过程中,我设计了一个经典的案例来展示 RAG 的能力。我构建了一个智能旅游助手,它不仅能回答“巴黎有哪些著名景点”这样的经典问题,还能结合最新的旅游政策、实时的天气信息和用户的个人偏好,给出个性化的建议。
我发现在解释 RAG 的检索过程时,可以使用很多描述人类思维的词汇:“联想”、“回忆”、“推理”...
这和我们思考好像是一样的:RAG 的检索过程其实很像人类的回忆机制。我们回忆往事时,很少是直接从大脑里“下载”完整信息。更多时候是通过一些关键词或情境线索,逐步唤起相关记忆,然后重新组织语言表达出来。
比如,当有人问你“大学时代最难忘的事”,你的大脑会先通过“大学”、“难忘”这些关键词,检索相关的记忆片段,然后筛选、排序,最后组织成一个完整的故事讲出来。
RAG 的工作原理也是这样:先通过关键词检索相关文档,再结合上下文生成回答。从这个角度看,RAG 不只是一个技术方案,更像是对人类认知过程的一种模拟和致敬。
04
信息获取的进化
另一个让我印象深刻的思考发生在写多模态 RAG 这一章。我意识到,我们获取信息的方式正在发生根本性变化。
还记得十年前,我们查资料主要靠文字搜索。但现在呢?一张信息图往往比千字长文更有说服力;一段短视频能传达比十篇论文更直观的知识;一个互动图表比静态数据更容易理解。
这就很像古代的象形文字,人类最初记录信息时,就是通过图像和符号。经历了几千年的文字时代后,我们似乎又在回归更直观的信息载体。
从这点出发,我在书中专门用了一整章来探讨多模态 RAG。我设计了一个案例:让 AI 同时处理一张梵高的画作和相关的艺术评论,然后回答“这幅画的色彩运用体现了什么情感”。结果就是——AI 不仅可以准确描述画作的技法特点,还能结合艺术史知识,给出深度的情感解读。
05
那些“踩过的坑”
在 RAG 的落地实践中,有一句玩笑话:RAG 实现用 1 天,调优用 1 年。
我记得在测试一个 RAG 系统时,遇到了一个问题。我问系统:“贝多芬的出生地是哪里?”它回答:“贝多芬的出生地是波恩,这里有很多美味的香肠和啤酒。”技术上没错,但总感觉哪里不对劲。
后来我发现,问题出在检索到的文档里有一篇德国美食介绍,恰好提到了波恩的特产。系统忠实地将所有相关信息都整合进了答案,结果产生了这种“画风突变”的回复。
这个小插曲让我意识到,RAG 系统的调优是一门艺术。它不仅需要技术功底,更需要对用户意图的深度理解。于是在第 6 章,我专门分享了这些“踩坑”经验,并总结出了一套实用的优化方法。
06
DeepSeek的启示
在写作过程中,正好赶上了 DeepSeek-R1 的横空出世。这个开源模型不仅在性能上媲美 GPT-4,更重要的是,它为 RAG 应用的普及打开了一扇新的大门。
我花了很多时间研究如何将 DeepSeek-R1 与 RAG 完美结合。在第 7 章的项目实战中,我用它构建了一个完整的智能旅游助手。这不仅仅是一个技术演示,更是对"开源 AI 民主化"这一理念的实践。
想象一下,一个小团队,用开源模型和开源框架,就能构建出媲美大厂产品的 AI 应用。这种可能性让人深深着迷。
07
致每个在 AI 路上探索的你
写这本书的过程,让我想起了自己初学编程时的兴奋和困惑。那时候,每一个成功运行的 Hello World 都让我激动不已,每一个 Debug 过程都是痛苦却有意义的成长。
现在的 AI 学习者面临着同样的挑战和机遇。RAG 技术看似复杂,但本质上是对人类认知过程的模拟。掌握了它,你就能让 AI 突破“记忆”的局限,获得“查阅”的能力。
这本书记录了我在 RAG 领域的探索历程,也承载着我对这个技术美好未来的期待。如果你也曾经因为 AI 的“胡言乱语”而苦恼,如果你也想让自己的 AI 应用更加智能和可靠,那么希望这本书能成为你探索路上的一个小小指南针。
在这个 AI 技术日新月异的时代,我们都是探索者。让我们一起在 RAG 的世界里,发现那些令人惊喜的可能性。
P.S. 写作期间,我的 RAG 系统帮我检索了上百篇论文,查阅了无数代码示例。可以说,这本书本身就是 RAG 应用的产物。这种“自指”的美妙,让我对技术的未来更加充满期待。
08
一本书攻克 RAG
《RAG极简入门:原理与实战》
张其来,徐思琪 | 著
一本注重 RAG 上手实践的书,没有堆术语,而是把整套 RAG 技术拆解得明明白白。
全书共 7 章内容,作者从背景原理讲起,到怎么搭框架、怎么处理数据、怎么做检索、生成、优化,每一块都有图、有例子,逻辑也特别清晰。甚至最后还贴心地加了个完整实战项目,让你从头跑一遍系统都不带卡壳的。
作者还绘制了超多流程图,帮助你理解复杂的概念。
不夸张地说,这本书不光让你知道 RAG 是什么,更重要的是,教你怎么把它真·用起来。
作者简介
张其来,高级算法工程师,拥有 7 年人工智能研发经验,先后就职于阿里、百度、滴滴、浪潮等互联网大厂,领导多项省部级大模型知识库研发项目。擅长写作,业余时间在公众号“芝士A|吃鱼”分享大模型、RAG、Agent 等知识。
徐思琪,天津大学硕士,高级研发工程师,深耕自然语言处理领域多年,持有多项发明专利并主导 10 余个工业级项目落地。研究聚焦智能问答系统、舆情分析及知识图谱构建三大方向,擅长基于业务场景打造全链路解决方案
专家推荐
本书系统介绍了 RAG 技术,并深入探讨其在实际业务中的应用。书中详细解析了知识图谱与多模态技术结合 RAG 的实践案例,提供丰富的经验与洞见。建议读者结合最新的大模型与多模态技术进展,将本书作为实践参考,助力项目高效落地与创新。
——孙佰贵,三一集团耘创新实验室首席架构师
在大模型蓬勃发展的今天,RAG 已成为提升 AI 系统知识更新能力、降低幻觉的重要手段。本书深入浅出地解析了检索增强生成技术的核心原理,从基础概念到前沿方法,构建了一个完整的知识体系。书中不仅系统讲解了向量化技术、知识检索策略、响应生成机制等 RAG 关键环节,更通过丰富的代码实例和项目实战,展示了技术如何落地应用。作者将抽象概念转化为可执行的工程实践,帮助读者快速掌握这一赋能大模型的关键技术。无论你是初涉 AI 领域的新手,还是寻求突破的资深工程师,都能在这里找到适合自己的知识增长点。
——樊中恺,百度主任架构师
大模型兴起后,RAG 作为最主流的技术架构形式之一,成为企业级应用标准。本书深入讲解了向量和检索技术,让读者能够真正掌握幻觉对抗、知识更新、过程白盒可溯源等 RAG 特性,是AI企业级应用设计和研发不可或缺的教材。
——卢向东(@土猛的员外),杭州萌嘉(TorchV)创始人&CEO
随着大模型技术的快速发展,RAG 技术作为其重要补充与优化手段,正成为 AI 领域的研究热点。本书为 RAG 技术的普及与发展提供了有力支持,该技术未来将在企业服务、商业智能、垂类AI应用等领域发挥核心作用。作者团队凭借深厚的行业积累与实践经验,将复杂的 RAG 技术以清晰易懂的方式呈现,帮助读者快速掌握并应用于实际项目。
——叶坚白,开源项目 Nano-GraphRAG、Memobase 作者
随着大模型技术的发展,RAG 作为融合检索与生成能力的关键方法,展现出巨大应用价值。本书从基础理论到实战操作,全面解析了 RAG 技术的核心要点,内容体系清晰、层次分明,非常适合初学者入门和实践。作者以通俗易懂的语言讲述了复杂的技术细节,并通过丰富的代码案例帮助读者快速上手,真正实现“即学即用”。对于希望在企业服务、知识管理、垂直领域 AI 开发等方向深入探索的开发者和研究者来说,这是一本不可多得的实用指南。
——闫强(@致Great)开源项目 Chinese-LangChain 与 TrustRAG 作者
RAG 技术以“原理简洁、实现繁复”著称,这使其在真实场景中面临系统调优难、工程落地难等诸多挑战。本书深入浅出地剖析了 RAG 系统的关键原理与实现要点,结合大量实践示例,帮助读者厘清复杂问题中的思路与解法。同时,书中还收录了部分前沿模型与最新研究成果,紧贴技术发展脉络。无论是初学者的系统入门,还是工程实践者的落地参考,本书都将提供切实可行的帮助与启发。
——闫宇坤,THUNLP 实验室客座研究员,开源项目 UltraRAG 负责人
一键下单
如果你觉得自己啃书太孤单,咱抱团学习,一起进步!快来扫码进群吧~👇