本文是LLM系列文章,针对《CKERC : Joint Large Language Models with Commonsense Knowledge for Emotion Recognition in Conversation》的翻译。
摘要
会话中的情绪识别(ERC)是一项在会话上下文中预测话语情绪的任务。它严格依赖于对话语境、说话人身份信息、多方对话场景等,而最先进的方法(instructionERC)只识别说话人,而忽略了会话中说话人背后的常识知识(即听众的反应和说话人的意图等),可以深度挖掘说话人信息。为此,我们提出了一种新的具有常识知识框架的大型联合语言模型,用于会话中的情感识别,即CKERC。我们使用大的语言模型设计了基于历史话语的提示来生成对话者的常识。我们使用LLM预训练的对话者常识识别任务来微调说话者的隐含线索信息。通过解决上述挑战,我们的方法达到了最佳状态。我们在三个广泛使用的数据集,即IEMOCAP、MELD和EmoryNLP上进行了大量实验,证明了我们的方法的优越性。此外,我们还进行了深入的分析,进一步证明了常识知识在大型语言模型中的ERC任务中的有效性。
1 引言
2 方法
3 实验设置
4 结果和分析
5 结论
在这项工作中,我们提出了CKERC,它使用先前文本中的历史话语来生成当前话语的常识(即听众的反应和说话者的意图等),并将常识引入说话者信息识别中
CKERC是一种结合常识知识的大型语言模型,用于对话中的情绪识别任务。它通过历史对话生成常识,改进了说话者信息的识别,提高了 ERC 的准确性。在IEMOCAP、MELD和EmoryNLP数据集上,CKERC展现出优越性能。
订阅专栏 解锁全文
2334

被折叠的 条评论
为什么被折叠?



