1. 自动推理与工具使用(ART)
将CoT提示和工具以交替的方式结合在一起,已被证明是一种强大且稳健的方法,用于解决许多LLM任务。这些方法通常需要手工设计特定任务的演示,并精心编排模型生成与工具使用的交替过程。Paranjape等人(2023年)提出了一种新框架,利用冻结的LLM自动生成作为程序的中间推理步骤。
ART的工作原理如下:
- 给定一个新任务,它从任务库中选择多步骤推理和工具使用的示例。
- 在测试时,每当调用外部工具时,它会暂停生成,并在恢复生成之前集成工具的输出。
ART鼓励模型从示例中泛化,分解新任务,并在适当的地方使用工具,采用零-shot方式。此外,ART是可扩展的,因为它还使人类能够通过简单地更新任务和工具库来修正推理步骤中的错误或添加新工具。以下是该过程的演示:
ART在BigBench和MMLU基准测试中,显著优于少量示例提示和自动CoT,并且在结合人工反馈时超过了手工编写的CoT提示的表现。
以下是展示ART在BigBench和MMLU任务上表现的表格: