在多智能体系统(MAS:multi-agent systems)中,设计有效的提示和拓扑结构面临挑战,因为单个智能体可能对提示敏感,且手动设计拓扑结构需要大量实验。
论文地址:https://arxiv.org/pdf/2502.02533
论文名称:Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies
为了自动化整个设计过程,Google & 剑桥大学首先对设计空间进行了深入分析,旨在了解构建有效MAS的因素。发现:提示设计对下游性能有显著影响,而有效的拓扑结构只占整个搜索空间的一小部分。
核心问题:
让多个AI(智能体)合作干活(比如一起解决数学题、分析复杂问题)通常比单个AI更厉害。但怎么设计它们合作的方式(工作流拓扑,比如谁先发言、谁汇总信息)和给每个AI的指令(提示词Prompt)是个大难题!手动试来试去效率低,效果还不好。
研究发现了什么?
- 提示词是“命门”: 研究发现,给单个AI的提示词写得好不好,对最终团队的表现影响巨大。指令写得好,AI就更能理解任务和有效合作。
- 拓扑结构要“精炼”: 虽然合作方式(拓扑结构)也重要,但研究惊讶地发现,真正管用的合作方式其实只占所有可能方式的一小部分。很多花里胡哨的结构可能没啥用甚至拖后腿(看图:有些优化过的拓扑结构还不如基础智能体单独干活呢)。
- 计算资源要用在“刀刃上”: 给单个AI优化好提示词,然后让多个这样的AI合作(投入更多计算资源/标记数),比单纯用更多资源堆砌但提示词没优化过的AI合作,效果提升明显得多(看图:优化提示后的Agent准确率随资源投入增长更快)。
- 优化要“从局部到全局”: 优化整个多智能体系统不能一锅烩。应该先单独优化每个AI的提示词(块级提示优化),再找最适合它们合作的流程(拓扑优化),最后再整体微调一下整个系统的提示词(全局提示优化)。这样一步一步来效果最好。
解决方案:Mass框架
为了解决这个设计难题,研究者提出了 Mass框架(名字来源于 Multi-Agent System Search),它就像一个自动化多智能体团队设计师,分三步走:
- 精兵强将(块级提示优化): 针对任务,Mass会自动给团队里的每一个AI成员(智能体) 优化它的专属指令(提示词)。确保每个成员都是精兵强将。
- 排兵布阵(工作流拓扑优化): Mass在筛选过的高效合作方式库里(基于前面的发现,剔除了大部分无效结构),自动找出最适合这群精兵强将的合作流程(拓扑结构)。比如谁先发言,谁来汇总意见,谁来执行。
- 团队协同(全局提示优化): 找到最优阵型后,Mass再对整个团队进行整体协调优化,微调提示词让团队配合更默契。
Mass框架牛在哪?
- 效果拔群: Mass设计出来的多AI团队,在多个任务(数学题、编码等)上吊打之前各种流行方法(比如CoT, Self-Refine, 多Agent辩论等),平均性能提升超过10%!
- 优化路线正确: 分三步(先单个优化成员,再定合作方式,最后整体优化)被证明是最优路径,每个阶段都能带来提升。
- 双管齐下: Mass同时优化提示词和拓扑结构,效果比只优化其中一样要好。
- 省钱高效: Mass在优化过程中表现稳定,用更少的尝试次数(样本效率高)就能找到好的设计,省时省钱。
- 想让多个AI合作好,给每个AI的指令(提示词)最关键。
- 让它们合作的流程(拓扑)不需要太复杂,简洁高效最重要。
- Mass框架是一个强大的自动化工具,它能通过三步优化法(精兵 -> 布阵 -> 协同),自动设计出提示词写得好 + 合作流程排得好的超级AI团队,效果碾压以前的方法,还更省钱。
Google和剑桥大学找到了让多个AI高效协作的秘诀(提示词是关键),发明了一个自动化工具(Mass)来帮你设计出最强AI团队!