【AI大模型】通过两个案例,看RAG如何解决大模型的“知识短板”!全程干货,建议收藏!!

前言

大模型和RAG一样,都是针对用户的问题,给出答复,那么,为什么有问题不直接问deepseek,还要跑一遍RAG?

RAG的出现,从根本上解决了大模型在处理知识时的一个核心痛点:如何高效、准确且低成本地利用那些未训练过的、私有的或最新的知识来回答问题。

如果我们希望大模型根据某些特定的知识内容生成答案,就必须将这些知识提供给模型。

似乎我们可以把这些知识全部发送给模型,但实际上并不可行

一方面,大模型本身的上下文长度有限,无法一次性处理大量内容

另一方面,即使上下文窗口未来不断扩大,每次提问都传入海量文档也会导致计算成本高昂、响应速度慢,并且可能引入无关信息干扰模型判断。

RAG通过“检索-增强-生成”的方式,针对用户的问题,系统首先在专用知识库中检索最相关的信息片段,仅将这些精选出的上下文传递给大模型。这样既克服了长度限制、降低了成本,也确保了模型作答的依据始终聚焦在我们提供的权威知识内。

同时,借助RAG的工作流设计,我们还可以控制大模型的思考路径,使其按照预设流程推理,而非随意发挥,进一步提升了回答的准确性与可靠性。

接下来,我们通过两个例子,详细介绍下如何用RAG实现信息聚焦和流程控制

信息聚焦

举一个沟通问题的例子。

比如我和我的室友沟通不太顺畅,希望AI可以给我一些建议。我希望AI使用《非暴力沟通》这本书的知识来指导我的沟通。

于是我问deepseek

我的室友经常不收拾屋子,让我很烦躁,所以我跟他说:“你总是不收拾屋子,让我很烦躁”,室友听了后显得很生气并且没有什么改变,我应该怎么跟他沟通才能解决这个问题

很明显,AI虽然给出了回答,但是不是我想要的,因为我希望使用到《非暴力沟通》的知识

当然,如果在提示词中,直接说明需要使用《非暴力沟通》的知识回答,deepseep也可以给我们想要的答案,这是因为DeepSeek在训练过程中很可能学习过这本书的相关内容,所以它能理解并执行这个指令

但是实际业务中,可能AI的最初训练资料中没有相关知识,所以你即使指定所用知识,AI也是无法回答的

此时,我们引入了RAG,来看看AI的回答

我们使用coze搭建一个简单的RAG

在COZE中,创建知识库并上传知识内容时,COZE按照一定的规则,做出知识分块、向量化等操作,我们不需要太复杂的工序即可搭建一个RAG

这里是使用《非暴力沟通》的PDF版本上传后作为一个知识库,然后在agent中调用这个知识库,让我们看看引入RAG后的回答

可以看到,我们使用了和给到deepseek相同的提示词,但是在这个回答中,AI给出的第一个回答正是按照书中观察、感受、需要、请求的四个要素给出沟通建议

当然,如果我们给deepseek的问题中,指定需要用非暴力沟通的方式作答,也是可以满足需求的

这是因为,当我没有指定用什么知识回答时,deepseek的知识范围是所有的训练内容,那就势必会让知识太过繁杂,导致无法按照我的预想回答。但是当我指定用非暴力沟通的知识回答时,deepseek也可以在他的训练知识中,提取这一块知识来回答

由此可以看出,当我们想要聚焦知识,或者有些知识不在大模型的初始训练知识内时,使用RAG,是一种实现目的的途径,将需要的信息整理到知识库内,通过知识库内的检索,让AI生成我们需要的答案

流程控制

仅仅让AI“知道”知识还不够,我们更需要它按照我们设定的专业流程来思考和工作,从而保证输出结果的高度一致性和专业性。这就是使用RAG的另一个强大能力——流程控制。

我们以一个非常实际的场景为例:一个自主研发的WMS(仓库管理系统)需要出海,所有界面、菜单、提示的文本都需要翻译成英文。

如果单纯靠人或直接让大模型翻译,会面临很多问题:

  • 不统一:不同的人对同一个词可能有不同的翻译。比如,“库位”有人译成 Location,有人译成 Storage Location,甚至可能是 Bin
  • 不专业:某些术语在物流行业有固定叫法。比如,“波次拣货”翻译成 Wave Picking 是专业术语,而按字面翻译成 Batch Order Picking 就显得很不专业。
  • 风格不一:对于大小写(是 Order 还是 order)、动词名词形式(是 Confirm 还是 Confirmation)没有统一规范。

直接提问大模型:“请将‘入库订单’翻译成英文”,你可能会得到各种答案,因为它没有上下文。

而通过RAG,我们可以构建一个专业的翻译工作流,让AI像一支训练有素的本地化团队一样工作。

整体思路如下

  1. 构建知识库:我们创建三个核心知识库。
  • 翻译规范库:存放强制性的翻译规则。例如:“‘货品’统一译为 Item,首字母大写”、“所有状态动词统一使用现在分词形式,如‘盘点中’译为 Counting...”、“‘库位’统一使用 Bin 而非 Location”。
  • 历史翻译库:存放已经审核通过的现有翻译键值对,作为最重要的参考。例如:{“入库订单”: “Inbound Order”, “出库订单”: “Outbound Order”}
  • 行业术语库:存放物流行业的通用英文术语标准,用于翻译新词或验证专业性。
  1. 设计控制流程:当接到一个翻译请求(例如:翻译“待上架货品”)时,AI不会直接回答,而是严格按照以下流程执行:
  • 第一步:检索
  • 首先,去 翻译规范库 检索是否有关于“货品”、“待”等字的强制规则。

  • 然后,去 历史翻译库 精确检索“待上架货品”是否有现成翻译。如果没有,则检索类似结构,如“待收货”、“待入库”的翻译是什么。

  • 最后,去 行业术语库 检索“上架”的标准专业术语是什么(通常是 PutawayStoring)。

  • 第二步:推理与生成
  • AI会综合所有检索到的信息进行推理:“历史库中‘货品’规定译为 Item,‘待’字前缀历史中常用 Pending(如‘待收货’是 Pending Receipt)。行业库中‘上架’是 Putaway。没有强制规则冲突。”
  • 最终,它生成的翻译是:Pending Putaway Item。这个结果既符合内部规范,又保持了历史统一性,还具备了行业专业性。

另一个例子:翻译一个全新的词“库存水位预警”。

  • 在历史库和规范库中都找不到直接答案。
  • AI流程会先在行业库中检索“库存水位”和“预警”的标准说法,可能会找到 Inventory LevelAlert
  • 然后它会参考历史翻译中“预警”是放在前面还是后面(例如“温度预警”是译作 Temperature Alert)。
  • 最终组合出符合公司习惯和专业性的 Inventory Level Alert

通过这样的流程控制,我们不再是简单地向AI提问,而是命令它执行一个复杂的、多步骤的决策程序。这确保了即使负责翻译的人员不断变动,AI也能作为一个永不离职、严格遵循SOP(标准作业程序)的专家,输出稳定、可靠、高质量的翻译结果。

总结

总而言之,RAG 的出现并非是为了替代像 DeepSeek 这样的大模型,而是对其能力的一种关键增强。

选择直接提问大模型还是使用RAG,本质上是选择“开放探索”与“精准执行”两种不同的模式。如果任务目标不是获取灵感,而是要求基于特定知识做出准确、可靠回答时,RAG就从一个可选项变为了必选项。它可以让AI从“通用对话”走向“专业赋能”的关键一步

最后

为什么要学AI大模型

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!

DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

img

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

海量AI大模型必读的经典书籍(PDF)

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告(实时更新)

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值