本文是LLM系列文章,针对《TWOSTEP: Multi-agent Task Planning using Classical Planners and
Large Language Models》的翻译。
摘要
像规划领域定义语言(PDDL)这样的经典规划公式允许在给定初始状态(如果可能的话)的情况下保证实现目标状态的动作序列。然而,PDDL中定义的推理问题并没有捕捉到动作采取的时间方面,例如,如果域中的两个代理的后条件不干扰另一个的前条件,则它们可以同时执行一个动作。人类专家可以将目标分解为很大程度上独立的组成部分,并将每个代理分配给这些子目标中的一个子目标,以利用同步操作更快地执行计划步骤,每个步骤只使用单个代理规划。相比之下,用于直接推断计划步骤的大型语言模型(LLM)并不能保证执行成功,而是利用常识推理来组装动作序列。我们结合了经典规划和LLM的优势,通过近似人类直觉进行双智能体规划目标分解。我们证明,与直接解决多代理PDDL问题相比,基于LLM的目标分解带来了更快的规划时间,同时实现了比单独的单代理计划更少的计划执行步骤,并保持了执行成功。此外,我们发现基于LLM的子目标近似可以实现与人类专家指定的多代理执行步骤相似的多代理运行步骤。网站和资源位于