本文是LLM系列文章,针对《Towards Understanding Counseling Conversations:Domain Knowledge and Large Language Models》的翻译。
摘要
了解咨询对话的动态是一项重要任务,但无论基于Transformer的预训练语言模型最近取得了什么进展,这都是一个具有挑战性的NLP问题。本文提出了一种系统的方法来检验领域知识和大型语言模型(LLM)在更好地代表危机咨询师和寻求帮助者之间的对话方面的功效。我们的经验表明,最先进的语言模型,如基于Transformer的模型和GPT模型,无法预测对话结果。为了给对话提供更丰富的上下文,我们结合了人类注释的领域知识和LLM生成的特征;领域知识和LLM特征的简单集成将模型性能提高了约15%。我们认为,当咨询会话被用作会话的附加上下文时,可以利用领域知识和LLM生成的特征来更好地描述咨询会话。
1 引言
2 咨询会话分析
3 模型
4 实验设置
5 讨论
6 相关工作
7 结论
我们研究了危机咨询师和寻求帮助者之间的对话动态。基于Transformer的模型和ChatGPT无法预测寻求帮助者在对话后是否感到积极。为了更好地描述咨询对话,我们整合了特定领域的知识、识别咨
本文探讨如何使用领域知识和大型语言模型(LLM)改进对咨询对话的理解。研究表明,尽管Transformer和GPT等先进模型在预测对话结果上表现不佳,但通过结合人类注释的领域知识和LLM生成的特征,能提升模型性能约15%,有助于更好地描述咨询会话的动态。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



