01 动机
近年来基于LLM的对话情感识别方法取得了大量进展,但现有工作仍然面临两个突出问题:(1)现有基于LLM的情感识别方法往往缺乏对多种模态信息的充分利用,如InstructERC仅利用文本模态信息。基于多模态大模型的情感识别方法,如Emotion-LLaMA和AffectGPT没有考虑对话结构和说话人感知的上下文依赖关系。(2)LLM难以对长程上下文中的依赖关系进行充分建模。分析实验结果表明,LLM在长对话中情感识别性能不佳。这主要来源于忽略了两种潜在的因果关系:话语驱动情感(C1);以及情绪驱动话语(C2)。为了有效整合多模态线索并解决其在处理上下文依赖关系方面的局限性,本文引入心理学中对偶系统理论提出的快思考和慢思考策略,提出了一种基于因果提示和大语言模型的多模态对话情感分析框架Causal-ERC。

图1 说明因果提示在ERC中作用的例子
02 方法
为了帮助LLM更有效地建模说话人敏感的上下文和多模态信息,同时可以捕捉对话中的隐式因果关系,从而提升其在对话情感分析的性能,论文提出了Causal-ERC框架,如图2所示。Causal-ERC利用各种模态对上下文信息进行建模,以有效地融合这些模态信息。同时分析每句话的情感强度,从而对因果关系进行分类并且选择相应的因果提示。最后Causal-ERC将融合后的表示与ERC提示得到的序列一起输入到LLM中进行情感识别。

图2 Causal-ERC结构示意图
1.多模态融合
为了帮助LLM捕捉对话中说话人和上下文的交互关系,并且可以有效整合多模态信息用于情感分析,我们首先对每种模态的特征进行建模,将它们融合为统一的表示,然后将结果输入到LLM中。
上下文建模。为了建模说话人感知的上下文信息,我们利用DialogueRNN作为编码器,为每个话语导出隐藏表示:

多模态融合。为了有效整合多模态信息并捕捉不同模态之间的一致性,我们设计了一个多模态融合模型,该模型由三个多头注意力层组成,建模文本、音频、视频模态之间的注意力关系:

2.因果提示
为了捕捉对话中的隐式因果关系,从而增强LLM对长期语境的建模能力,论文引入了因果提示。首先,为了判断每句话的因果类型,应用峰终定律,根据情感强度对每个话语的因果关系进行分类。然后,为了引导LLM根据句子的因果类型针对性地调整注意力分布,根据识别出的因果类型设计定制的因果提示。整个流程概述于算法1中。

算法1 因果提示的流程
峰终定律。峰终定律是一种心理学启发式方法,它表明人们对一段经历的评价主要基于其最强烈时刻(“峰”)和结束时刻(“终”)的感受,而不是基于整个经历中每个时刻的平均感受。这条定律解释了为什么人们对事件的记忆往往会受到情绪激烈的时刻和最终印象的显著影响。具体来说,这意味着某些话语,尤其是那些情绪强度高或出现在结尾的话语,会对人们对整个对话的情感感知产生更强烈的影响。
03 实验
**在两个多模态对话数据集(**IEMOCAP,MELD)上,将Causal-ERC与现有的方法进行了对比:

表1 总体实验结果
结果显示,我们的Causal-ERC在两个数据集的性能均超过了现有的方法。

表2 消融实验结果
移除一致性损失,多模态融合或因果提示模块后,模型的性能均有所下降,证明了它们的必要性。

表3 多模态分析实验
随着模态数量的增加,Causal-ERC的性能提高。说明模型可以有效融合多模态信息。

图3 引入因果提示之后,不同位置token的注意力分数的变化情况
引入因果提示之后,模型对更远处token的注意力分数提高,对更近处token的注意力降低。说明该方法可以提升LLM建模长上下文的能力。

图4 引入因果提示之后对话中各个长度的句子的性能提升情况
引入因果提示之后,模型的性能在各个位置普遍提升,在长对话的提升尤为明显。
04 结论
本文提出了一种基于多模态LLM的新型因果提示框架Causal-ERC,用于多模态对话情感分析。Causal-ERC融合了多模态信息,并利用说话人信息进行语境建模。此外,Causal-ERC能够通过峰终定律分析每个话语的因果关系,并选择相应的因果提示,从而提升长期语境建模能力。在IEMOCAP和MELD数据集上的大量实验验证了Causal-ERC的有效性。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》,下方扫码获取~

① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

以上资料如何领取?

为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!


这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


以上全套大模型资料如何领取?


被折叠的 条评论
为什么被折叠?



