TWOSTEP: Multi-agent Task Planning using Classical Planners and Large Language Models

本文是LLM系列文章,针对《TWOSTEP: Multi-agent Task Planning using Classical Planners and
Large Language Models》的翻译。

TWOSTEP:使用经典规划器和大型语言模型的多智能体任务规划

摘要

像规划领域定义语言(PDDL)这样的经典规划公式允许在给定初始状态(如果可能的话)的情况下保证实现目标状态的动作序列。然而,PDDL中定义的推理问题并没有捕捉到动作采取的时间方面,例如,如果域中的两个代理的后条件不干扰另一个的前条件,则它们可以同时执行一个动作。人类专家可以将目标分解为很大程度上独立的组成部分,并将每个代理分配给这些子目标中的一个子目标,以利用同步操作更快地执行计划步骤,每个步骤只使用单个代理规划。相比之下,用于直接推断计划步骤的大型语言模型(LLM)并不能保证执行成功,而是利用常识推理来组装动作序列。我们结合了经典规划和LLM的优势,通过近似人类直觉进行双智能体规划目标分解。我们证明,与直接解决多代理PDDL问题相比,基于LLM的目标分解带来了更快的规划时间,同时实现了比单独的单代理计划更少的计划执行步骤,并保持了执行成功。此外,我们发现基于LLM的子目标近似可以实现与人类专家指定的多代理执行步骤相似的多代理运行步骤。网站和资源位于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值