Enhancing Large Language Models with Coarse-to-Fine Chain-of-Thought Prompting for Multi-domain NLU

最新推荐文章于 2025-11-25 12:11:01 发布

UnknownBody

最新推荐文章于 2025-11-25 12:11:01 发布

阅读量234

点赞数

CC 4.0 BY-SA版权

文章标签：语言模型人工智能自然语言处理

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/134253012

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

本文提出了一种从粗到细的思想链（CoFCoT）方法，用于增强大型语言模型（LLM）在自然语言理解（NLU）任务中的性能。该方法通过分解任务并利用AMR结构化知识，帮助LLM进行多步骤推理，适应零样本和少样本多域设置。实验表明，CoFCoT在多粒度NLU任务中有效提高了LLM的能力。

本文是LLM系列文章，针对《CoF-CoT: Enhancing Large Language Models with Coarse-to-Fine
Chain

摘要

虽然思维链提示在推理任务中很受欢迎，但它在自然语言理解（NLU）中的大型语言模型（LLM）中的应用却很少被探索。受LLM多步骤推理的启发，我们提出了从粗到细的思想链（CoFCoT）方法，该方法将NLU任务分解为多个推理步骤，LLM可以在这些步骤中学习获取和利用基本概念来解决不同粒度的任务。此外，我们建议利用基于语义的抽象意义表示（AMR）结构化知识作为中间步骤，来捕捉话语的细微差别和不同结构，并理解它们不同粒度水平之间的联系。我们提出的方法在帮助LLM适应零样本和少样本多域设置下的多粒度NLU任务方面被证明是有效的。

1 引言

2 相关工作

3 提出的框架

4 实验

5 结果与讨论

6 结论

在这项工作中，我们对LLM在对话系统的多粒度NLU任务中的能力进行了初步研究。此外，在CoT的激励下，我们提出了一种新的CoF-CoT方法，旨在将NLU任务分解为多个推理步骤，其中（1）LLM可以学习从不同粒度的NLU任务中获取和利用概念，（2）在整个多步骤推理中可以集成和利用额外的AMR结构化表示。我们实证证明了CoF-CoT在零样本和少样本多域设置下提高多粒度NLU任务中LLM能力的有效性。