论文主要内容总结
本文提出了CodeAgents,一种基于结构化伪代码的提示框架,旨在解决现有LLM提示策略在多智能体环境中存在的token效率低、模块化不足、可扩展性有限等问题。该框架将多智能体交互的核心组件(任务、计划、反馈、角色、工具调用等)编码为带有控制结构(如循环、条件)、布尔逻辑和类型变量的模块化伪代码,将松散的智能体计划转化为连贯、可解释、可验证的多智能体推理程序。
通过在GAIA、HotpotQA、VirtualHome三个基准测试上的实验,CodeAgents展现出显著优势:相比自然语言提示基线,任务成功率提升3-36个百分点(其中在VirtualHome上达到56%的新state-of-the-art);输入和输出token使用量分别减少55-87%和41-70%,验证了其在提升性能的同时优化token效率的能力。
论文创新点
- 代码优先的多智能体提示:将复杂推理任务编码为模块化伪代码,在单一LLM中协调规划、推理、反馈等专用智能体,大幅降低冗余性。
- 以token效率为核心指标:在提示设计和评估中明确优化token使用,在不牺牲推理质量的前提下高效利用LLM资源。
- 技术创新增强表达性与效率:引入类型变量(减少错误)、控制流结构(支持动态推理)、可重用子程序(提升模块化),支持动态重规划。
- 统一的多智能体与单智能体范式:通过结构化伪代码实现两种范式的统一,适应不同任务特征,兼顾通用性

订阅专栏 解锁全文
9182

被折叠的 条评论
为什么被折叠?



