KAG LLM + 图谱的五方面增强:知识表示增强、图结构与文本互索引、符号引导的拆解和推理、知识对齐、模型,支付宝支小宝、蚂蚁集团应用算法,医疗问答指标解释准确率 > 93%
- 理解
- 整体架构设计
- 知识压缩
- 解法拆解
- 推理过程
- KAG 对比微软 GraphRAG
- 类比
- 知识表示的增强
- 1. 从静态二元到多元动态:
- 2. DIKW层次表示:
- 3. 三种建模方式的统一:
- 4. LLM友好的知识表示:
- 5. 实际应用优势:
- 图结构与文本互索引:将原有的 term-based 倒排索引升级为 graph-based 倒排索引
- 1. 传统的term-based倒排索引:
- 2. 升级后的graph-based倒排索引:
- 3. 具体示例展示:
- 4. 检索过程对比:
- 5. 优势:
- 混合推理:符号决策、向量检索与大模型
- 1. 混合推理的三个核心组件:
- 2. 案例:糖尿病诊疗决策
- 3. 推理流程示例:
- 4. 各组件优势互补:
- 5. 实际应用场景:
- 6. 决策路径示例:
- 符号引导的拆解和推理
- 基于概念的知识对齐
论文: https://arxiv.org/pdf/2409.13731
代码: https://github.com/OpenSPG/KAG
理解
KAG是一个通过结合知识图谱(KG)和检索增强生成(RAG)来增强大语言模型(LLM)的框架。
与主要依赖向量相似度的传统RAG不同,KAG集成了结构化的知识推理。
纯向量相似度检索无法很好处理需要多跳推理的问题。
- 知识表示方式:从纯文本到结构化知识图谱
- 检索策略:从单纯相似度匹配到逻辑形式引导
- 推理方法:从单次检索到多轮反思机制
- 知识对齐:从独立知识到语义关联网络
主要组件:
- 面向LLM的知识表示
- 数据/信息/知识的层次化组织
- 图结构和文本之间的互相索引
- 同时支持无模式和有模式约束的知识
- 逻辑形式求解器
- 将复杂查询分解为子问题
- 集成知识图谱推理和文本检索
- 使用反思机制进行多轮求解
- 知识对齐
- 标准化来自不同来源的知识
- 将实例链接到领域概念
- 自动完成语义关系
实验结果:
- 显著超越现有RAG方法:
- HotpotQA提升19.6% F1分数
- 2WikiMultiHopQA提升33.5% F1分数
- 成功应用于蚂蚁集团的电子政务和电子健康场景
局限性:
- 处理阶段需要多次调用LLM,导致计算开销大
- 复杂问题分解需要较高的能力
- 基于OpenIE的抽取会引入噪声,需要额外的对齐工作
关键洞见:
通过将结构化的知识图谱推理与传统检索相结合,KAG能够实现更准确和更有逻辑性的响应,特别是在需要多跳推理的复杂领域特定查询方面。
主要应用:
- 电子政务问答:帮助用户解答关于服务方法、所需材料、服务条件等问题
- 医疗健康问答:支持疾病、症状、疫苗、手术等专业医疗知识咨询
创新点:
- 引入了逻辑形式来指导检索和推理,使系统能更好地处理复杂查询
- 设计了知识对齐机制来提高知识的准确性和连通性
- 实现了图结构和文本的双向增强
这个框架的重要性在于它为构建专业领域的知识服务提供了一个可行的方案,既保持了大语言模型的灵活性,又具备了知识图谱的精确性和可解释性。
整体架构设计
KAG 由三大核心模块构成:
- KAG-Builder (知识构建器)
- 负责离线索引构建
- 进行信息抽取和结构化
- 执行知识图谱存储
- 处理语义对齐
查询是,双重检索。
先结构化图谱搜索和推理,当图谱无法回答,变成非结构化文本信息检索。
- KAG-Solver (求解器)
- 采用逻辑形式引导推理
- 结合知识图谱和语言模型推理
- 整合多种检索方法
- 支持多轮反思迭代
逻辑形式求解器:将复杂查询分解为可执行步骤,整合图检索和文本检索,多轮反思和迭代求解。
- KAG-Model (模型增强)
- 增强自然语言理解(NLU)能力
- 提升自然语言推理(NLI)能力
- 改进自然语言生成(NLG)能力

知识压缩
LLMFriSPG 框架通过三层结构压缩知识:
- 原始文档 (医学教材/指南片段):
- 文本块(RC):
通过语义分块,将原文分成多个独立但相关的知识块:
- 图信息(KGfr):
将文本块转化为实体和关系的图结构:
- 规范知识(KGcs):
将图信息规范化为标准化的医学知识:
这个转化过程展示了信息是如何逐步被结构化和规范化的:
- RC层保留了原始语义但提供了更清晰的结构
- KGfr层将非结构化文本转换为可计算的图结构
- KGcs层引入了标准化的专业规范和可执行的规则
在这个过程中:
- 信息密度不断提高
- 知识结构更加规范
- 可计算性逐步增强
- 专业性持续提升
这种层次化的知识表示让系统能够:
- 在RC层处理自然语言问题
- 在KGfr层进行知识推理
- 在KGcs层执行专业决策
解法拆解
推理过程
将复杂问题分解为基本推理模式:

最低0.47元/天 解锁文章
748

被折叠的 条评论
为什么被折叠?



