大模型提示词-提示技巧三(方向刺激性提示、ReAct提示与Reflexion) -(专题2)

1. 自动推理与工具使用(ART)

将CoT提示和工具以交替的方式结合在一起,已被证明是一种强大且稳健的方法,用于解决许多LLM任务。这些方法通常需要手工设计特定任务的演示,并精心编排模型生成与工具使用的交替过程。Paranjape等人(2023年)提出了一种新框架,利用冻结的LLM自动生成作为程序的中间推理步骤。

ART的工作原理如下:

  • 给定一个新任务,它从任务库中选择多步骤推理和工具使用的示例。
  • 在测试时,每当调用外部工具时,它会暂停生成,并在恢复生成之前集成工具的输出。

ART鼓励模型从示例中泛化,分解新任务,并在适当的地方使用工具,采用零-shot方式。此外,ART是可扩展的,因为它还使人类能够通过简单地更新任务和工具库来修正推理步骤中的错误或添加新工具。以下是该过程的演示:
在这里插入图片描述
ART在BigBench和MMLU基准测试中,显著优于少量示例提示和自动CoT,并且在结合人工反馈时超过了手工编写的CoT提示的表现。

以下是展示ART在BigBench和MMLU任务上表现的表格:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI专题精讲

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值