【干货收藏】从RAG到Advanced RAG：大模型检索增强生成技术详解

最新推荐文章于 2025-11-26 15:49:07 发布

原创最新推荐文章于 2025-11-26 15:49:07 发布 · 740 阅读

CC 4.0 BY-SA版权

文章标签：

本文系统介绍了RAG技术的基本概念、工作流程及Advanced RAG演进路径。从基础RAG的检索-增强-生成三阶段出发，详细解析了T-RAG、GraphRAG、HippoRAG、KAG等变体如何通过结合知识图谱、实体树等技术解决基础RAG的多模态数据不足、上下文不精准等问题，并简要介绍了HippoRAG2的最新改进，为大模型应用提供了技术参考。

1、RAG 与微调？

首先看看面对大模型的一些问题，通常情况下提出的两个解决思路，RAG 和微调，它们的区别是什么？简单来说 RAG 可以理解成是对照的书本找答案，微调是针对答案去学习。

2、RAG是什么？

从上文可以看出，RAG 的诞生就是其实为了尽量补充大模型的一些缺点，简单概括一下基础的 RAG 它的几个阶段：

1.检索（Retrieval）： 从外部知识库中检索与用户查询相关的信息。

2.增强（Augmentation）： 将检索到的信息与模型的内部知识结合起来，构建上下文。

3.生成（Generation）： 基于增强后的上下文，生成最终的回答。

3、基于文档检索的 RAG 有什么缺点？

但基础的 RAG 技术还是有缺陷，从上面的步骤拆解去看，就能发现：

它难以容纳多模态数据。
检索到的上下文可能不够精准，导致生成的回答不够准确。
对于复杂的跨文档推理任务，传统 RAG 方法可能表现不足。
需要维护一个庞大的知识库，增加了存储和计算成本。

那么如何优化 RAG呢？

针对这些缺点再往前衍生，探索 RAG 与其他技术结合的方式，能不能继续增强 RAG 的能力，有几篇论文来介绍这种衍生，这里可以举几个例子如下。

4、T-RAG 是什么？

它的全称是 Tree-RAG（T-RAG），将检索增强生成（RAG）与经过微调的开源大型语言模型（LLM）相结合，以生成响应。具体来说，T-RAG 在检索过程中，利用实体树来增强从向量数据库检索到的上下文。所以相比 RAG，它结合了树形结构，利用内部实体树增强上下文信息，适用与更复杂的场景。‌

它的原理简单概括就是：

1. 实体检测： 用户查询前扫描查询内容，识别出与组织内实体名称相对应的关键字。

2. 实体信息提取：从实体树中提取与匹配实体相关的详细信息。

3. 上下文构建： 将实体信息与从向量数据库检索到的文档块合并，构建更全面的上下文。

4. 生成回答： 基于增强后的上下文，生成最终的回答。

所以论文里有一个等式就是：T-RAG=RAG+微调+实体检测

5、GraphRAG 是什么？

如果说 T-RAG 是通过实体树增强，那 GraphRAG 就是通过整合知识图谱（KG）来增强 RAG。这里引入一个新概念知识图谱，它是一种基于关系存储和链接相关或不相关数据的数据结构，简单理解就是知识的动态网络。

它的原理简单概括就是：

索引过程：将文档中的实体和关系提取出来，构建知识图谱。
查询过程：在检索时，利用知识图谱中的关系信息，跨文档传播信息，生成更准确的回答

附上论文中对这个过程的概括：

6、HippoRAG 是什么

关于构建图的还有另一个代表，就是 HippoRAG，它是一种受大脑海马体启发的 RAG 变体，旨在帮助大型语言模型跨段落整合新知识。它是一个受神经生物学启发的大语言模型长期记忆框架，各个组件均旨在模拟人类记忆的不同侧面。主要由三个部分构成：人工新皮层（LLM）、旁海马区域（PHR 编码器）以及人工海马（开放知识图谱，Open KG）。就是图中的这 3 个大脑。

下面的过程就是它的检索原理：分两个路径，一是离线索引，LLM 将文段处理为知识图谱三元组，并将其整合到人工海马索引中；同时，PHR 负责检测同义关系以实现信息互联。二是在线检索，LLM（作为人工新皮层）从查询中抽取命名实体，而 PHR 编码器则将这些实体链接到海马索引上。随后，对知识图谱应用个性化 PageRank（PPR）算法，进行基于语境的检索。

简单示例：

查询：寻找一位从事阿尔茨海默症研究的斯坦福教授。

➡ 传统 RAG： 可能需要一个段落同时提到“斯坦福教授”和“阿尔茨海默症”才能识别出相关信息。

➡HippoRAG： 通过关联图将“斯坦福教授”和“阿尔茨海默症”相关联，从而识别出托马斯教授。

7、GraphRAG 类的缺点？

依赖开放信息抽取方法，引入了大量的数据噪声，知识精准度差。
使用图结构实现跨文档的信息传播，缓解了向量召回的不足。例如需要多跳、复杂逻辑依然存在不足。LLMs推理能力有限。
检索到错误。噪声的信息后生成错误答案，仍然可能存在幻觉。
GraphRAG 运行速度非常慢，因为它需要多个 LLM API 调用，可能会达到速率限制。
成本极高
以实体为中心的方法在索引和推理过程中导致语境信息的丢失，并且在语义匹配上存在困难。

8、KAG是什么？

KAG（Knowledge-Augmented Generation，知识增强生成）是一种结合知识图谱和生成模型的技术，通过引入结构化的知识，提升生成内容的准确性和相关性。

KAG 的核心功能包括：

知识与 Chunk 互索引结构，以整合更丰富的上下文文本信息
利用概念语义推理进行知识对齐，缓解 OpenIE 引入的噪音问题
支持 Schema-Constraint 知识构建，支持领域专家知识的表示与构建
逻辑符号引导的混合推理与检索，实现逻辑推理和多跳推理问答

可以看下这个官方简图：

看起来是 KBQA+HippoRAG 结合产出的一种技术，先看一下 KBQA 是什么

9、KBQA 是什么？

知识图谱问答（Knowledge-based Question Answering, KBQA）是指给定自然语言问题，通过对问题进行语义理解和解析，进而利用知识库进行查询、推理得出答案。

传统的基于搜索引擎的问答系统只能返回一些时效性的网页，以文档集合的形式呈现给用户，仍然需要用户阅读并分析文档以获取答案。而基于知识图谱的问答系统可以实现获取到更精确的答案，即在知识图谱中找到精确答案直接返回给用户，满足用户的精确信息需求，提供个性化知识服务。

KBQA 的缺点？

那 KBQA 有什么问题？

1.依赖高质量的知识图谱，图谱构建门槛高，高质量的知识图谱需要大量人力

2.信息损失大，知识图谱中只包含了实体、关系、属性等，相对信息丰富的原始文本，信息损失较大

3.可阅读性差，生成的答案包含关键事实，上下文信息较少

10、KAG 是怎么解决这些问题的？

这个图其实很好的说明了 KAG 的思路，就是在KBQA+HippoRAG情况下，再重点强调推理，所以它也重点强调它是应用于垂直问答领域，特点是：

兼容强Schema专业知识和弱Schema开放信息
图结构知识与文本知识的互索引结构
专业领域可平滑调节的专业决策与信息检索, 丰富知识完备性
通过开放信息+结构化构建做知识语义对齐，平衡信息抽取(低门槛)与专业构建，缓解开放信息抽取引入的噪声问题

11、HippoRAG2 是什么？

当然技术发展非常快速，重新搜索HippoRAG 的时候，发现最近也出了HippoRAG2 ，相比其他技术表现非常优异，它与 HippoRAG 1 相比在结构上遵循类似的离线索引与在线检索两阶段流程，但在此基础上引入了几个关键改进，以更好地契合人类记忆机制：

无缝整合开放知识图谱中的概念信息与语境信息，提升索引的完整性和粒度；
利用知识图谱结构中超出单一节点的信息，促进了更具语境敏感性的检索；
引入了识别记忆机制，以改善图搜索中种子节点的选择。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】