KAG(Knowledge Augmented Generation)的专业知识服务框架

KAG(Knowledge Augmented Generation)的专业知识服务框架,旨在通过结合知识图谱(KG)和检索增强型生成(RAG)技术的优势,提高大型语言模型(LLM)在专业领域的问答能力。以下是对文章核心内容的详细介绍:

背景知识

  • RAG技术的局限性:RAG技术虽然能有效利用外部检索系统为LLM提供特定领域知识,减少幻觉问题,但在多跳和跨段任务中表现不佳。其依赖文本或向量相似性检索参考信息的方式可能导致检索结果不完整和重复,且对数值、时间关系等逻辑关系不敏感,无法满足专业领域如法律、医学等对分析推理的高要求。

  • 知识图谱的优势:知识图谱以明确的语义方式组织信息,使用SPARQL和SQL等查询语言可精确指定实体类型和关系,进行推理性知识检索。其查询结果具有明确语义,可作为变量用于LLM的规划和功能调用,完成确定性推理。

研究方法

  • KAG框架的提出:为充分利用知识图谱和RAG技术的互补特性,提出了KAG框架。该框架不仅将图结构整合到知识库流程中,还引入了知识图谱中的语义类型、关系以及逻辑形式,通过五个关键方面增强LLM和KG:LLM友好的知识表示、知识图谱与原始文本块的双向索引、逻辑形式引导的混合推理引擎、基于语义推理的知识对齐以及KAG模型能力增强。

  • LLM友好的知识表示:提出了LLMFriSPG框架,从数据、信息和知识的层级结构出发,升级SPG以适配LLM。支持模式自由的信息提取和模式约束的专家知识构建,实现图结构和原始文本块之间的互索引表示,便于统一表示、推理和检索逻辑形式。

  • 知识图谱与文本块的互索引:通过信息提取、语义对齐和图存储写入等过程,在KAG-Builder模块中构建知识图谱与文本块之间的互索引。包括语义分块、带描述性上下文的信息提取、领域知识注入与约束以及文本块向量与知识结构的互索引。

  • 逻辑形式引导的混合求解引擎:将自然语言问题转化为结合语言和符号的问题解决过程,包括规划、推理和检索三种操作符。通过逻辑函数解析问题并执行推理,实现检索、知识推理、语言推理和数值计算四种问题解决过程的集成。

  • 基于语义推理的知识对齐:在离线索引增强和在线检索阶段,利用领域概念和术语知识进行知识对齐,提高知识的标准化和连通性,作为用户问题与索引之间的桥梁。

  • KAG模型:为支持KAG框架所需的各项功能,增强通用LLM的自然语言理解(NLU)、自然语言推理(NLI)和自然语言生成(NLG)能力,提高各功能模块的性能。

实验

  • 数据集与评估指标:在HotpotQA、2WikiMultiHopQA和MuSiQue三个多跳问答数据集上进行实验,使用精确匹配(EM)和F1分数评估问答性能,基于Top 2/5检索结果的命中率计算检索性能。

  • 对比方法:与NativeRAG、HippoRAG和IRCoT等RAG方法进行对比。

  • 实验结果:KAG在HotpotQA和2wiki上的F1分数相对提高了19.6%和33.5%,在E-Government和E-Health问答任务中相比RAG方法有显著提升。

关键结论

  • 性能提升:KAG通过更有效的索引构建、知识对齐和混合求解库,在多跳问答任务中显著优于现有方法。

  • 专业领域应用:在E-Government和E-Health问答场景中,KAG展现出更高的准确性,增强了专业领域问答应用的可信度。

  • 开源支持:计划在开源KG引擎OpenSPG上原生支持KAG,降低开发者的应用门槛,推动KAG的本地化发展。

应用案例

  • E-Government问答:基于KAG框架构建了支付宝政务服务问答应用,支持回答用户关于服务方式、所需材料、服务条件和服务地点的问题。通过语义分块策略对政府服务文档进行分块,构建索引,并在推理求解阶段生成逻辑函数执行问题求解。

  • E-Health问答:基于支付宝健康管家场景开发了医疗问答应用,支持疾病、症状、疫苗等医学科普问题回答,以及医疗指标解读、医疗推荐等。利用医学专家整理的权威医学文档构建高质量KG,并生成逻辑形式查询KG以回答用户问题。

局限性与未来工作

  • 计算和经济成本:KAG框架在构建和求解阶段需要多次调用LLM,导致计算和经济成本增加。

  • 问题分解和规划能力:复杂问题的分解和规划对模型能力要求高,目前KAG框架在此方面尚未进行优化。

  • 知识对齐技术挑战:OpenIE虽降低了KG构建门槛,却增加了知识对齐的技术挑战,需进一步优化多知识提取的准确性和多轮提取的一致性。

  • 未来方向:未来工作将探索降低KG构建成本、提高推理的可解释性和透明度,如多知识提取、基于OneGraph的知识对齐、领域知识注入等。同时,还将研究如何利用KAG作为奖励模型反馈和评估模型的准确性、稳定性和可解性,以提升规划模型能力,并与OpenKG社区合作解决LLM与KG协作中的关键技术问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值