Progressive-Hint Prompting Improves Reasoning in Large Language Models

最新推荐文章于 2025-11-25 00:15:54 发布

UnknownBody

最新推荐文章于 2025-11-25 00:15:54 发布

阅读量1.9k

点赞数

CC 4.0 BY-SA版权

文章标签：语言模型自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/132325339

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

本文介绍了一种新的提示方法——渐进提示（PHP），用于改善大型语言模型（LLM）的推理性能。PHP利用先前生成的答案作为提示，通过多次交互引导用户找到正确答案。实验证明，PHP能显著提高效率和准确性，特别是在解决复杂问题时，与复杂思想链（CoT）和自一致性方法结合使用效果更佳。

本文是LLM系列的文章，针对《Progressive-Hint Prompting Improves Reasoning
in Large Language Models》的翻译。

渐进提示改进了大型语言模型中的推理

摘要
1 引言
2 相关工作
3 渐进提示Prompting
4 实验
5 结论
6 实现细节
7 不足与未来工作
8 广泛的影响
9 具有不同提示的模型响应

摘要

大型语言模型（LLM）在推理任务中的性能在很大程度上取决于提示设计，思想链（CoT）和自洽性是增强这种能力的关键方法。然而，这些方法并没有充分利用LLM生成的答案来指导后续响应。本文提出了一种新的提示方法，称为渐进提示（PHP），通过使用以前生成的答案作为提示，逐步引导用户找到正确的答案，实现用户和LLM之间的自动多次交互。PHP与CoT和自一致性正交，因此可以轻松地与最先进的技术相结合，以进一步提高性能。我们在七个基准上进行了广泛而全面的实验。结果表明，PHP在保持高效的同时显著提高了准确性。例如，使用text-davinci-003，我们观察到与复杂CoT相比，贪婪解码的GSM8K改进了4.2%，自一致性的样本路径减少了46.17%。通过GPT-4和PHP，我们在SVAMP上实现了最先进的性能（89.1%→ 91.9%）、GSM8K（92%→ 95.5%）、AQuA（76.4%→ 79.9%）和数学（50.3%）→ 53.9%）。

1 引言

2 相关工作

3 渐进提示Prompting

4 实验

5 结论

6 实现细节

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。