Agent-as-a-Graph:知识图谱助力大模型多智能体系统性能提升15%!

简介

Agent-as-a-Graph是一种创新的知识图谱检索方法,通过将工具和代理表示为知识图谱中的节点和边,解决了大语言模型多智能体系统中代理选择不精准的问题。该方法采用三步检索流程(向量搜索、加权重排序、图遍历),在LiveMCP基准测试中实现了14.9%的Recall@5和14.6%的nDCG@5性能提升,结合了代理级别和工具级别检索的优势,为多智能体系统提供了更精准的代理选择方案。


文章摘要

本文提出了一种创新的知识图谱检索方法Agent-as-a-Graph,通过将工具和代理表示为知识图谱中的节点和边,解决了大语言模型多智能体系统中代理选择不精准的问题。该方法在LiveMCP基准测试中实现了14.9%和14.6%的性能提升。

原文pdf:https://t.zsxq.com/izQiK


一、研究背景:多智能体系统面临的挑战

随着大语言模型(LLM)技术的快速发展,多智能体系统已经能够实现大规模的编排和检索,这些系统由数百甚至数千个专业化的子代理组成,每个子代理都配备了大量的模型上下文协议(MCP)服务器和工具。这些智能体可以执行复杂的任务,如与数据API交互、协同代码开发以及执行特定领域的问答任务。

然而,随着可访问的代理包和工具服务器数量达到数百甚至数千个规模,为特定查询识别正确的代理及其内部的具体工具变得越来越具有挑战性。现有的基于检索器的工具和代理选择系统存在显著的局限性:它们通常只针对单一的代理描述进行查询匹配,这种方式掩盖了每个代理的细粒度工具能力,导致代理选择效果不佳。

1.1 现有方法的两大困境

当前的策略主要分为两类,各有其明显的缺陷:

第一类:仅代理检索(Agent-only Retrieval)
这类方法将查询与简短的代理描述进行匹配,然后仅在该代理内部操作。当代理描述与查询不一致时,可能会隐藏代理的相关MCP服务器和工具,导致检索失败。

第二类:仅工具检索(Tool-only Retrieval)
这类方法将每个工具独立对待,忽略了周围工具包在多步骤任务中的互补优势。这种方式虽然能够精确定位单个工具,但无法利用代理级别的上下文信息。

最新的研究基准已经突出了多步骤工具选择中的这些挑战,并在不同的工具存储库中评估代理性能。此外,先前的最先进方法尝试在同一向量空间中连接代理描述和工具描述,但这种连接字段在检索增强生成中存在多跳查询限制。


二、Agent-as-a-Graph:创新的知识图谱检索方法

为了解决上述局限性,研究团队提出了Agent-as-a-Graph——一种基于知识图谱的检索增强生成方法,将工具及其父代理表示为知识图谱中的节点和边。

2.1 核心创新点

1. 统一的知识图谱表示
Agent-as-a-Graph在统一的向量空间中嵌入工具和代理,同时将它们表示为知识图谱中的节点,通过元数据边显式地将每个工具链接到其父代理。这种知识图谱结构在保持细粒度工具能力的同时,通过图遍历维护了代理级别的上下文。

2. 三步检索流程
检索过程包括三个主要步骤:

  • 步骤一:通过向量搜索首先检索相关的代理和工具节点
  • 步骤二:应用类型特定的加权倒数排名融合(wRRF)对工具和代理进行重排序
  • 步骤三:在知识图谱中遍历父代理,获得最终的代理集合

3. 加权倒数排名融合(Weighted Reciprocal Rank Fusion)
研究团队提出了一种针对初始检索的代理和工具的类型特定加权机制,这种方法比非重排序方法提高了2.41%的性能。

2.2 知识图谱构建与索引

系统将模型上下文协议(MCP)服务器及其对应的代理集合建模为双向知识图谱G = (A, T, E),其中:

  • A代表代理节点集合
  • T代表工具节点集合
  • E代表所有权关系边
2.2.1 目录结构

统一的代理-工具知识图谱包含两种节点类型:

工具节点(CT)
包含工具名称和描述,直接在知识图谱中索引用于检索。每个工具节点包含元数据边,显式地将其链接到父MCP服务器或代理节点。这种边结构使得在查询解析期间能够从检索到的工具遍历到相应的可执行代理。

代理节点(CA)
包含代理名称和描述,表示更高级别的能力,并作为知识图谱结构中的父节点。代理节点聚合了其关联工具的能力,当不需要工具级别的特定性时,提供粗粒度的检索目标。

2.3 检索算法详解

检索过程修改了标准的top-K排名程序,使其能够在知识图谱结构和相关目录上运行。目标是为给定的查询或子查询识别最相关的top-K个代理。

算法流程:

  1. 首先从知识图谱目录C中检索top N(N >> K)个节点,按照与查询的语义相似度排序
  2. 通过沿着所有权边进行图遍历聚合相应的父代理
  3. 选择top-K个唯一的代理


三、实验评估与性能分析

3.1 评估基准:LiveMCPBenchmark

研究团队在LiveMCPBenchmark上对Agent-as-a-Graph进行了全面评估,该基准测试涵盖了八种嵌入模型的性能表现。

3.2 核心性能指标

实验结果显示了显著的性能提升:

与先进方法的对比:

  • Recall@5提升14.9%

    :相比于之前的最先进检索器

  • nDCG@5提升14.6%

    :展现了更优的排序质量

  • wRRF优化提升2.41%

    :证明了加权策略的有效性

绝对性能指标:

  • Recall@5达到0.85
  • nDCG@5达到0.48(使用最优的类型特定加权)

3.3 检索来源分析

对检索结果的深入分析揭示了知识图谱结构的价值:

  • 39.13%的检索项来自代理节点

    :表明代理级别描述的重要性

  • 34.44%通过图边从工具节点追溯

    :证明了工具级别检索的必要性

这一发现确认了两种节点类型都对路由性能有实质性贡献,验证了Agent-as-a-Graph统一建模方法的合理性。


四、相关工作与技术演进

4.1 代理路由和工具选择的发展

工具选择和代理路由的核心问题是从大型存储库中识别最相关的工具或代理,以回答用户查询。

早期方法:
早期基于检索器的方法依赖于词汇匹配技术,如TF-IDF和BM25,将查询与工具描述对齐。这些方法虽然简单有效,但在语义理解方面存在局限。

现代方法:
最近的工作构建了工具知识库和密集检索器,为给定查询对单个工具进行排序,通常在大规模场景下展现出强大的单遍性能。除了静态匹配,查询和调用重写方法通过缓解用户意图与工具规范之间的不匹配来改善结果,而渐进式和迭代式选择则通过分解复杂任务来提高召回率。

分层和自反思代理:
这类代理能够决定是否使用工具以及使用哪些工具,但它们通常在每个决策步骤中要么采用代理优先,要么采用仅工具的粒度,无法同时利用两者的优势。

4.2 知识图谱在检索中的应用

传统的检索增强生成(RAG)方法在处理多跳查询时存在局限性。知识图谱结构能够通过显式建模实体间关系来克服这一问题,使系统能够进行更复杂的推理和遍历。


五、技术优势与应用价值

5.1 对专业机构的价值

1. 企业应用场景

  • 提升智能客服系统效率

    :通过精准的代理选择,减少响应时间

  • 优化内部知识管理

    :更好地组织和检索企业知识库中的工具和资源

  • 增强决策支持系统

    :为复杂业务场景提供更准确的工具推荐

2. 科研院所应用

  • 加速科研工作流

    :快速定位适合特定研究任务的工具和模型

  • 促进跨学科协作

    :通过统一的知识图谱连接不同领域的工具和方法

  • 支持大规模实验管理

    :高效管理和调度数千个实验工具

3. 投资决策参考

  • 技术趋势判断

    :知识图谱+LLM的结合代表了重要的技术发展方向

  • 市场潜力评估

    :多智能体系统在企业级应用中具有广阔前景

  • 竞争优势分析

    :14.9%的性能提升具有显著的商业价值

5.2 技术创新的深远影响

Agent-as-a-Graph为日益复杂的代理生态系统中基于知识图谱的检索奠定了基础,并激发了未来研究方向:

  • 查询自适应类型权重

    :根据不同查询类型动态调整代理和工具的权重

  • 结构感知图先验

    :利用图结构的先验知识进一步优化多智能体编排

  • 可扩展性增强

    :支持更大规模的代理和工具生态系统


六、未来展望

随着多智能体系统扩展到数百个专业代理协调数千个工具和MCP服务器,将查询路由到正确的代理仍然是一个基本挑战。Agent-as-a-Graph提供了一个创新的解决方案,通过知识图谱结构实现了工具和代理的统一表示和检索。

6.1 研究方向

未来的研究可以在以下方向进行拓展:

  1. 动态图结构更新

    :支持代理和工具的动态添加和删除

  2. 多模态知识图谱

    :整合文本、代码、图像等多种模态信息

  3. 联邦学习应用

    :在保护隐私的前提下实现跨组织的代理协作

  4. 实时性能优化

    :进一步降低大规模系统的检索延迟

6.2 产业应用前景

该技术在以下领域具有广阔的应用前景:

  • 智能制造

    :工业互联网中的设备和服务协调

  • 金融科技

    :复杂金融产品的智能推荐和风险评估

  • 医疗健康

    :临床决策支持系统中的知识检索

  • 智慧城市

    :城市管理中的多系统协同优化


七、结论

Agent-as-a-Graph代表了多智能体系统检索技术的重要进展。通过将工具和代理表示为知识图谱中的共同节点,并通过显式的元数据边链接,该方法实现了统一的检索框架。实验结果表明,在八种嵌入模型上,Agent-as-a-Graph始终优于经典和当代基准方法。

对于专业机构而言,这项技术不仅提供了理论创新,更重要的是展示了可落地的性能提升。14.9%的Recall@5改进和14.6%的nDCG@5提升,意味着在实际应用中能够显著减少错误的代理选择,提高系统的整体效率和用户满意度。

随着人工智能技术的不断发展,多智能体系统将在更多领域发挥关键作用。Agent-as-a-Graph为这一领域的发展提供了坚实的技术基础,值得企业、科研机构和投资者的持续关注。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到优快云的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​
在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。

img
智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

在这里插入图片描述

​​
在这里插入图片描述

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​在这里插入图片描述
在这里插入图片描述

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值