本文是LLM系列文章,针对《CoF-CoT: Enhancing Large Language Models with Coarse-to-Fine
Chain
摘要
虽然思维链提示在推理任务中很受欢迎,但它在自然语言理解(NLU)中的大型语言模型(LLM)中的应用却很少被探索。受LLM多步骤推理的启发,我们提出了从粗到细的思想链(CoFCoT)方法,该方法将NLU任务分解为多个推理步骤,LLM可以在这些步骤中学习获取和利用基本概念来解决不同粒度的任务。此外,我们建议利用基于语义的抽象意义表示(AMR)结构化知识作为中间步骤,来捕捉话语的细微差别和不同结构,并理解它们不同粒度水平之间的联系。我们提出的方法在帮助LLM适应零样本和少样本多域设置下的多粒度NLU任务方面被证明是有效的。
1 引言
2 相关工作
3 提出的框架
4 实验
5 结果与讨论
6 结论
在这项工作中,我们对LLM在对话系统的多粒度NLU任务中的能力进行了初步研究。此外,在CoT的激励下,我们提出了一种新的CoF-CoT方法,旨在将NLU任务分解为多个推理步骤,其中(1)LLM可以学习从不同粒度的NLU任务中获取和利用概念,(2)在整个多步骤推理中可以集成和利用额外的AMR结构化表示。我们实证证明了CoF-CoT在零样本和少样本多域设置下提高多粒度NLU任务中LLM