From Summary to Action: Enhancing Large Language Models for Complex Tasks with Open World APIs

828 篇文章

已下架不支持订阅

本文介绍Sum2Act,一种新型推理框架,旨在通过控制大量真实世界API来增强LLM处理复杂任务的能力。与ReAct和DFSDT等方法相比,Sum2Act在ToolBench基准上表现出显著的性能提升,特别是在处理视觉和文本数据集成的任务上。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《From Summary to Action: Enhancing Large Language Models for Complex Tasks with Open World APIs》的翻译。

从总结到行动:使用开放世界API增强大型语言模型用于复杂任务

摘要

人类和动物的区别在于人类使用和创造工具的独特能力。工具使人类能够克服生理限制,促进伟大文明的创造。同样,使大型语言模型(LLM)等基础模型具有学习外部工具使用的能力,可能是实现通用人工智能的关键一步。该领域先前的研究主要采用两种不同的方法来增强LLM的工具调用能力。第一种方法强调构建用于模型微调的相关数据集。相反,第二种方法旨在通过情境学习策略充分利用LLM固有的推理能力。在这项工作中,我们介绍了一种新的工具调用管道,旨在控制大量的真实世界API。该管道反映了人工任务解决过程,解决了复杂的现实用户查询。在每一步,我们都会指导LLM总结所取得的成果,并确定下一步的行动方案。我们将这条管道称为“从总结到行动”,简称Sum2Act。在ToolBench基准上对我们的Sum2Act管道进行的经验评估显示,性能显著提高,优于ReAct和DFSDT等既定方法。这突出了Sum2Act在增强复杂现实世界任务的LLM方面的有效性。

1 引言

2 相关工作

3 方法

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值