本文是LLM系列文章,针对《Contrastive Chain-of-Thought Prompting》的翻译。
摘要
尽管思维链在增强语言模型推理方面取得了成功,但其基本过程仍不太清楚。尽管逻辑上合理的推理似乎对思维链至关重要,但先前的研究令人惊讶地表明,当使用无效的演示时,影响最小。此外,传统的思维链并没有告知语言模型应该避免哪些错误,这可能会导致更多的错误。因此,受人类如何从正面和负面例子中学习的启发,我们提出了对比思维链来增强语言模型推理。与传统的思维链相比,我们的方法提供了有效和无效的推理演示,以引导模型逐步推理,同时减少推理错误。为了提高泛化能力,我们引入了一种自动构建对比演示的方法。我们在推理基准上的实验表明,对比思维链可以作为思维链提示的一般增强。
1 引言
2 不同类型对比论证的效果初探
3 对比思维链
4 实验
5 相关工作
6 结论
在这项工作中,我们探索了利用无效推理演示来增强思维链的效果。通过对不同无效思维链类别的初步研究,我们发现以对比的方式提供有效和无效的演示大大提高了语言模型