Enhancing Robustness in Large Language Models: Prompting for Mitigating the Impact of Irrelevant

最新推荐文章于 2025-11-24 18:29:32 发布

UnknownBody

最新推荐文章于 2025-11-24 18:29:32 发布

阅读量337

点赞数 6

CC 4.0 BY-SA版权

分类专栏： LLM Daily LLM Prompt 文章标签：语言模型人工智能

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/142139471

LLM Daily 同时被 2 个专栏收录

1687 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

LLM Prompt

40 篇文章

订阅专栏

本文是LLM系列文章，针对《Enhancing Robustness in Large Language Models: Prompting for Mitigating the Impact of Irrelevant Information》的翻译。

摘要

近年来，大型语言模型（LLM）因其在复杂推理任务中的卓越表现而受到广泛关注。然而，当问题描述包含不相关的信息时，即使使用高级提示技术，最近的研究也可能会显着削弱他们的推理能力。为了进一步研究这个问题，构建了一个包含不相关信息的小学数学问题数据集，名为 GSMIR。在此数据集上测试突出的 LLM 和提示技术表明，虽然 LLM 可以识别不相关的信息，但一旦识别出来，它们并不能有效减轻它造成的干扰。为了解决这一缺点，提出了一种新的自动构造方法 ATF，它增强了 LLM 识别和自我减轻不相关信息影响的能力。此方法分两步进行：首先，分析不相关的信息，然后进行过滤。实验结果证明，ATF 方法显著提高了 LLM 和提示技术的推理性能，即使在 GSMIR 数据集上存在不相关的信息时也是如此。