本文是LLM系列文章,针对《From Summary to Action: Enhancing Large Language Models for Complex Tasks with Open World APIs》的翻译。
摘要
人类和动物的区别在于人类使用和创造工具的独特能力。工具使人类能够克服生理限制,促进伟大文明的创造。同样,使大型语言模型(LLM)等基础模型具有学习外部工具使用的能力,可能是实现通用人工智能的关键一步。该领域先前的研究主要采用两种不同的方法来增强LLM的工具调用能力。第一种方法强调构建用于模型微调的相关数据集。相反,第二种方法旨在通过情境学习策略充分利用LLM固有的推理能力。在这项工作中,我们介绍了一种新的工具调用管道,旨在控制大量的真实世界API。该管道反映了人工任务解决过程,解决了复杂的现实用户查询。在每一步,我们都会指导LLM总结所取得的成果,并确定下一步的行动方案。我们将这条管道称为“从总结到行动”,简称Sum2Act。在ToolBench基准上对我们的Sum2Act管道进行的经验评估显示,性能显著提高,优于ReAct和DFSDT等既定方法。这突出了Sum2Act在增强复杂现实世界任务的LLM方面的有效性。