前言
AI应用最害怕的就是模型幻觉,同一个问题收到不同的回答是令人绝望的事情,想象一下:
- 你如果是一个患者,同一个问题,医生给了你两个回答,你慌不慌?
- 你如果是一个律师,同一个问题,律师给了你完全不同的结果,你怕不怕?
现阶段做AI应用来说,想解决不光是模型问题,还想让AI回答得更好,而回答得更好,就需要借助外部知识库,从而诞生了RAG这个技术。
RAG是一个融合了基于检索和基于生成模型优势的框架。
它会从知识库中检索相关的外部信息(通常是文档或段落),并依据这些信息,组装提示词,而后模型会针对用户的查询生成更精准、上下文更丰富的回答。
其工作工程如下,首先是传统流程:
- 问题:“在美国,什么是房东和租户之间的法律义务?”
- 提示词:
你是一个资深律师,现在有用户问你法律问题,请你解答。
当前用户的问题是:
在美国,什么是房东和租户之间的法律义务?
- 结果:“在美国,房东和租户之间的法律义务包括租金支付、物业维护、终止合同和保证房产安全。然而,具体的法律义务因州而异,租户和房东必须遵守当地的法规。”
这里可能的问题:
- 缺乏具体的法律依据。
- 没有提到具体的条文或具体州的法律规定,可能会给用户带来误导,尤其是在需要明确法律依据时。
其次是RAG流程,主要看提示词的变化:
你是一个资深律师,现在有用户问你法律问题,请你解答。
当前用户的问题是:
在美国,什么是房东和租户之间的法律义务?
以下是检索到的相关法律条文和案例,帮助你回答用户问题:
- 根据《美国统一住宅租赁法》第504条,房东有责任确保租赁物业保持适宜的居住条件,并进行必要的维修和保养。
- 根据《加利福尼亚州民法典》第1941.1条,房东必须确保租赁物业提供安全的居住环境,包括处理供水、供暖等系统问题。
- 《纽约州租赁法》第227条规定,房东有义务确保物业符合当地建筑标准,并为租户提供安全的居住条件。
- 美国法院在多个案例中判定,房东未能履行上述义务时,租户有权要求赔偿,包括但不限于租金减免或搬迁费用。
请根据以上法律条文与案例回答用户的问题。
于是答案是:
根据《美国统一住宅租赁法》第504条,房东有责任确保租赁物业保持适宜的居住条件,并负责进行维修和保养。此外,在加利福尼亚州,根据《加利福尼亚州民法典》第1941.1条,房东必须确保租赁物业提供安全的居住环境,包括处理供水和供暖等系统问题。如果房东未履行这些义务,租户可以根据法律要求赔偿。此外,依据《纽约州租赁法》第227条,房东还需确保物业符合当地建筑标准,并为租户提供安全的居住条件。在多个法院判例中,房东未能履行上述责任时,租户有权要求赔偿,包括租金减免或搬迁费用等。
在这个基础上,用户会认为答案更为靠谱,因为相关的权威条款、信息来源全部被带出来了。
RAG是非常好的解决模型幻觉框架,并且能显著提升模型回答质量,但在实际使用过程中,会发现他对模型不太友好,因为他只能提供数据片段,而不能提供数据+逻辑。
其实这本身不是什么问题,只需要在RAG上叠加工程能力,让他具备逻辑能力即可,其核心在于AI应用基于的知识库本身结构化程度。
基于此,业内提出了一套新的框架KAG(Knowledge Augmented Generation)知识增强生成,想要去解决RAG的一些缺陷,今天我们就主要介绍这是什么东西。
RAG的缺陷
因为RAG 存在着向量相似度与知识推理相关性差距大、对知识逻辑(如数值、时间关系、专家规则等)不敏感等问题,这些缺陷阻碍了专业知识服务的落地。
这里大家可能不太了解是什么,举个例子:
假设你正在开发一个医学知识服务系统,用户输入一个病症的描述,系统需要根据病历数据提供相关的诊断信息。
假设用户输入的是:“病人出现反复头痛、恶心和呕吐,体检发现血压升高。”
RAG模型首先会从知识库中检索出一些相似的病例和可能的诊断。
这时,模型可能会检索到与“高血压”相关的病例,但是未必能从这些检索到的信息中得出合适的诊断,因为这个问题涉及到多个病理因素(如血压、神经系统异常等)的关联。
输入提示词:“病人头痛、恶心、呕吐,血压升高,可能的诊断”
检索库:症状、疾病、诊断记录
生成模型输出:可能检索到“高血压”和“头痛”相关的疾病,但缺乏深度推理,可能忽略了“神经系统异常”这个关键点。
为了解决这个问题,我们需要本地知识库本身具备逻辑性及关联性(也就是更加结构化)。
比如这里的头痛与高血压会被明确关联,并且每个症状或疾病的相关因素(如“神经系统异常”)也可以作为附加信息在图谱中关联起来。
在使用RAG时,除了只检索知识片段信息,还要增加推理逻辑,例如,使用基于规则的推理系统或者推理层来增强模型的推理能力。
比如:检索到“头痛”和“高血压”时,推理系统可以进一步检查是否存在“神经系统异常”的可能性,或者推理是否存在其他潜在的关联(如“脑部问题”)。
推理引擎可以分析相关的病理信息,自动推理出潜在的因果关系,避免漏掉“神经系统异常”等关键点。
以下是完整的案例:
输入提示词:病人头痛、恶心、呕吐、血压升高。
检索库:症状与疾病的知识图谱。
检索出与“头痛”和“高血压”相关的疾病。
发现与“高血压”相关的并发症,如“脑部异常”,并自动标记“神经系统异常”作为潜在问题。
推理引擎激活:
推理系统检查“头痛”和“高血压”的组合,发现此组合可能会引发神经系统异常,进一步推理出“脑卒中”或“颅内压增高”等疾病可能性。
生成模型:
结合检索到的信息和推理引擎的结论,生成模型输出:“病人可能存在高血压导致的头痛,建议进行脑部CT检查以排除神经系统异常。”
以上就是通过行业KnowHow与工程能力,对RAG技术进行了进一步保证达到的效果,可以看出他和现在DeepSeek的think功能很类似的。
在这个基础下,我们再看看阿里这边推出的KAG框架。
KAG
10月24日,OpenSPG 发布 v0.5 版本,正式发布了知识增强生成(KAG)的专业领域知识服务框架。
KAG 旨在充分利用知识图谱和向量检索的优势,并通过四个方面双向增强大型语言模型和知识图谱,以解决 RAG 挑战:
- 对LLM友好的知识表示
- 知识图谱与原文片段之间的互索引
- 逻辑形式引导的混合推理引擎
- 与语义推理的知识对齐。
其技术架构如下:
其核心为知识串联:
本质是将用户问题可能相关的信息以及推理逻辑都带上,由于模型上下文多了,所以模型的表现会更好。
从这里便可以看出KAG与RAG的区别了,KAG通过将结构化知识图谱或外部知识库直接融入模型架构,来提升语言模型的生成能力。
与检索非结构化数据(文档或文本)的RAG不同,KAG侧重于整合结构化知识,以此提高生成质量。
因为KAG本质依赖的是知识图谱,那么其回答质量必定会高很多,但也就是其依赖的知识图谱,无论其初始数据导入还是后续图谱的更新都很麻烦。
KAG很厉害的是,他有一套框架,可以自动生成关系链,这个很屌的:
下面是一个复杂案例的完整展示过程:
代表作为《王右丞集》诗人,其家乡被司马迁称之为什么?
其背后的数据库如下:
一个案例
按照官方引导,安装好程序:
解析过程的日志:
图谱生成:
答案生成:
用官方文档效果要:
但总的来说,不太准…
看了下过程,将文章生成结构化的知识图谱这块不太准确,总的来说有很长的路要走!
结语
实际KAG使用过程中BUG不少:
应该还不太成熟,只不过产品侧有些考虑提前放了出来,但从长远来说,我认为KAG是最终答案。
RAG利用外部知识库的检索功能来生成更丰富的答案,虽然它有效解决了模型幻觉问题,但仍然存在对复杂推理能力的欠缺。
而KAG通过结合结构化的知识图谱与推理引擎,能够为语言模型提供更具逻辑性和关联性的答案,从而显著提升生成的质量。
然而,KAG的高效性和准确性也依赖于知识图谱的结构化程度以及数据的维护更新,这一过程可能会较为复杂。
无论是RAG还是KAG,它们的核心目标是增强AI模型在特定应用场景下的推理与生成能力,尤其是在医学、法律等专业领域中,这对于提高模型回答的准确性和可靠性至关重要。
最后的最后
感谢你们的阅读和喜欢,作为一位在一线互联网行业奋斗多年的老兵,我深知在这个瞬息万变的技术领域中,持续学习和进步的重要性。
为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。
这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。
这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】

大模型知识脑图
为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
经典书籍阅读
阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
面试资料
我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】
