- 博客(30)
- 收藏
- 关注
原创 ER论文阅读-GJFusion: A Channel-Level Correlation Construction Method for Multimodal Physiological Signal
基于生理信号的无处不在的计算(ubiquitous computing)已经引起了广泛的关注。然而,跨模态生理信号之间的异质性为实际应用带来了重大挑战。为了弥合这一异质性差距,最近的研究集中在建立模态之间的跨模态相关性上。早期的工作主要关注模态嵌入之间的粗粒度相关性,而更近期的基于图的研究则引入了先验知识的相关性,尽管这些相关性可能并不完全准确。在本文中,我们提出了。
2024-10-24 15:07:31
1082
1
原创 MASA-TCN: Multi-Anchor Space-Aware Temporal Convolutional Neural Networks for Continuous and Discret
基于脑电图(EEG)信号的情感识别是生物医学研究中的一个关键领域,应用广泛,从精神障碍调节到人机交互。在本文中,
2024-10-22 15:25:29
857
原创 ER论文阅读-LMR-CBT: Learning Modality-fused Representations with CB-Transformer for Multimodal Emotion R
在获得三种模态的特征表示后,我们设计了一种带有跨模态块(CB-Transformer)的新型Transformer,以实现不同模态的互补学习,主要分为局部时间学习、跨模态特征融合和全局自注意力表示。在跨模态特征融合部分,使用基于残差的模态交互方法,获取三种模态的融合特征。与单模态相比,多模态提供了更多的信息,能够充分反映情感状态。我们提出了一种高效的神经网络,使用CB-Transformer(LMR-CBT)从未对齐的多模态序列中学习融合模态的表示(仅0.41M参数),能够有效融合三种模态的交互信息。
2024-09-23 21:05:03
999
1
原创 ER论文阅读-PGCN: Pyramidal Graph Convolutional Network for EEG Emotion Recognition PGCN
在过去十年中,基于脑电图(EEG)的情感识别因其卓越的准确性和可靠性而被广泛研究,图卷积网络(GCN)已成为从EEG信号中解码情感的主流模型。特征提取有助于揭示EEG信号中的情感相关信息,从而实现更准确的情感识别。与之前大多只使用二维电极关系进行GCN构建的工作相比,PGCN将节点之间的绝对位置、相对位置和数值关系融合到网络中,同时借鉴情感相关的神经科学先验研究,构建大脑区域的虚拟中观中心。基于情感相关神经科学的先验知识,我们设计了不同的中观区域并计算它们的虚拟中心,以区分不同脑区在情感识别任务中的作用。
2024-09-23 21:01:07
1103
5
原创 ER论文阅读-DMMR: Cross-Subject Domain Generalization for EEG-Based Emotion Recognition via Denoising Mi
实验结果表明,在SEED和SEED-IV数据集上的准确率分别达到88.27%(士5.62)和72.70%(土8.01),表现出最先进的和具有可比性的性能,展示了DMMR的优越性。因此,不同主体的数据存在显著的分布差异,使得在源主体数据上训练的模型难以有效泛化到目标主体。在SEED(Zheng 和 Lu, 2015)和SEED-IV(Zheng 等, 2019)数据集上的实验准确率分别达到了88.27%(±5.62)和72.70%(±8.01),实现了最先进的可比性能,展示了DMMR的优越性。
2024-09-22 14:43:55
1291
1
原创 ER论文阅读-Incomplete Multimodality-Diffused Emotion Recognition
为了恢复缺失的模态,IMDer利用基于分数的扩散模型,将输入的高斯噪声映射到缺失模态的期望分布空间,并根据其原始分布恢复缺失数据。特别地,为了减少缺失模态和恢复模态之间的语义歧义,现有的模态被嵌入为条件,以引导和优化基于扩散的恢复过程。为了恢复缺失的模态,IMDer利用了流行的基于分数的扩散模型,该模型将输入的随机噪声映射到缺失模态的分布空间。在拥有足够数据和模型容量的情况下,我们能够通过解决逆时间SDE(即去噪过程),从先验噪声分布开始,利用训练良好的分数模型恢复分布一致的模态。
2024-09-22 14:08:21
1178
1
原创 ER论文阅读-Beyond Mimicking Under-Represented Emotions: Deep Data Augmentation with Emotional Subspace C
Luo和Lu,2018)。例如,AMIGOs数据集(Santamaria-Granados等,2018)倾向于较高的唤醒评分,而DEAP数据集(Koelstra等,2011)相比负面情绪包含更多的积极情绪(Wang等,2022)。如图1(a)所示,如果某个情感类别缺乏足够的数据,模仿观测到的分布将增加样本密度,但不能像数据丰富的类别那样填充潜在的情感子空间,这将阻碍无偏情感识别系统的发展。首先,我们提出了EEG编辑范式,通过编辑参考EEG信号,将其从数据较丰富的情感子空间转换到数据较少的情感子空间。
2024-09-21 14:31:43
688
2
原创 ER论文阅读-Multivariate, Multi-frequency and Multimodal: Rethinking Graph Neural Networks for Emotion Re
此外,Bo等人表明,低频信息保留了节点特征的共性,在同类图(链接的节点倾向于有相似的特征并共享相同的标签)中表现更好。一种常见的解决方案是构建一个异构图,其中话语的每个模态被视为一个节点,既与同一话语的其他模态连接,也与同一对话中相同模态的话语连接。尽管取得了进展,但这一范式往往低估了模态和上下文之间的多变量关系,因为它限制了松散耦合的多模态和上下文建模之间的自然交互。为了解决这些问题,本文提出了多变量多频多模态图神经网络(M3Net),旨在捕捉模态和上下文之间更充分的多变量关系,同时利用图中的多频信息。
2024-09-21 13:42:21
942
2
原创 ER论文阅读-Decoupled Multimodal Distilling for Emotion Recognition
多模态Transformer中的跨模态注意机制强化了多模态表示,并减少了不同模态中存在的高级语义概念之间的差异。对于MER,同一视频片段中的不同模态通常是互补的,能够提供额外的线索,用于语义和情感的消歧。如图1(a)所示,语言在MER中发挥着最重要的作用,而模态之间的固有异质性导致了不同模态在性能上的显著差异。我们提出了一种解耦的多模态蒸馏框架,即解耦的多模态蒸馏(DMD),用于学习模态间的动态蒸馏,以实现稳健的多模态情感识别。此外,不同模态间的显著特征分布不匹配,使得直接的跨模态蒸馏效果不佳。
2024-09-20 19:33:07
1572
1
原创 ER论文阅读-Revisiting Disentanglement and Fusion on Modality and Context in Conversational Multimodal Em
使机器在对话场景下理解多模态情境中的人类情感一直是一个热门研究课题,这也是多模态对话情感分析(MM-ERC)所承担的任务。近年来,MM-ERC受到了持续的关注,各种方法被提出以提升任务的性能。大多数现有的研究将MM-ERC视为一个标准的多模态分类问题,并通过多模态特征的解耦与融合来最大化特征的效用。然而,重新审视MM-ERC的特性后,我们认为在特征解耦与融合的过程中,应该同时正确建模特征的多模态性和对话的上下文关联性。在本研究中,我们的目标是通过充分考虑上述见解进一步提升任务性能。
2024-09-20 17:12:18
1015
1
原创 ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review
论文的介绍部分首先涵盖了情感分类以及用于识别情感的技术。随后,对信号记录的几种方法(包括EEG[211]、温度[212]、心电图[213]、肌电图[214]和皮电反应[215])的优缺点进行了回顾。接下来,本文讨论了EEG信号的重要性及其在情感识别中的挑战。最后,本文阐述了DL技术相比于ML技术在基于EEG信号进行情感识别中的优势。第2节回顾了基于DL技术的EEG信号情感识别的相关文献。所回顾的文献发表时间为2016年至2023年。
2024-09-17 17:01:50
2170
1
原创 ER综述论文阅读-Emotion Recognition from Multiple Modalities:Fundamentals and Methodologies
Q1期刊;2021人类是情绪化的生物。当我们表达情感时,通常涉及多种形式,无论我们是显性地(例如,面部表情、语音)还是隐含地(例如,文本、图像)。使机器具有情绪智能,即识别、解释、处理和模拟情绪,正变得越来越重要。在本教程中,我们将讨论多模式情感识别(MER)的几个关键方面。我们首先简要介绍了广泛使用的情感表征模型和情感通道。然后,我们总结了现有的情感标注策略和相应的计算任务,并对MER中的主要挑战进行了描述。
2024-09-16 16:39:22
2187
1
原创 A Letter to Research Students 给研究生的一封信 译文
重新考虑相关研究也能提醒你重要的贡献,并使你的目标与该领域中他人的目标保持一致。由于此文件需要频繁编辑,最好以电子形式存储(BibTEX 是一个不错的系统,适合组织文献信息,也是与他人交换参考文献的便捷方式)。你参与的研究,理想情况下,是一个流水线的一部分。你的工作建立在他人的基础之上,并产生有用的成果。作为一个快节奏领域的参与者,你有责任保持了解,进行适当的实验以验证你的假设,并以一种使研究界能够访问的方式展示你的结果。为了让你的时间尽可能的高效且有趣,我收集了一些你可能觉得有用的“组织提示”。
2024-09-11 14:53:43
909
1
原创 Research Primer for Graduate Students 关于在研究生阶段如何做研究的一些建议
在课程计划审查(POS)过程中,您的导师将决定您在研究生学习期间要修读的课程。您的提案应是一个完整的文件,涵盖Locke等人所识别的问题。总体而言,Locke等人指出,您的提案将向委员会传达您的意图,作为您和委员会的研究计划,并最终作为双方的契约(如果您按计划完成工作,您将顺利毕业)。在记录您的研究时,请记住委员会将期望您的论文展示出您已经满足了他们所提出的要求。委员会成员之一将成为您的论文导师,这是一个关键的决策,因为您的导师将指导、审查并批准您的所有工作。您的导师可能或可能不了解您的研究领域。
2024-09-11 13:33:49
710
原创 mac 配置Haskell工具链 GHCup
参考文档:https://mirror.xyz/0xdB4907968b599f0fb530693eF457BdE801544031/sG9PAIIVhL7urJNSze_xnjg409QYGZFgvmnqxUriuOk如何安装 Haskell 工具链(2022 年版) - 知乎补充:
2023-04-09 10:47:10
286
原创 小菜狗保研记--2023计算机夏令营预推免经验贴总结
目录2023计算机夏令营预推免总结🎈背景分析🎈夏令营【厦门大学信息学院】🎈预推免【南京理工计算机学院】【北邮计算机学院】【哈工威计算机学院】【厦大电影学院】【西工大计算机】【成电计算机】🎈小结🎈背景分析学校:中下游211专业:数字媒体技术学业绩点排名:4/60最终推免排名:2/60英语成绩:四级550+,六级570+,雅思7.0竞赛经历:都是水水比赛,国家级只有一个英语比赛,2-3个省级比赛,2-3个校级比赛科研经历:图像降噪普刊论文🎈夏令营。
2022-10-08 12:15:58
5848
25
原创 学习笔记:《视听语言》(完结)-9/9 短片创作-中国大学慕课公开课
中国大学MOOC平台上线的中国传媒大学《视听语言》专属课程,将与你相约在春日,一起探索视听语言艺术的奥秘,快来加入我们吧!电影的拍摄速度超过了24画格/秒时,我们便称之为升格拍摄,升格拍摄的画面到了银幕上以正常速度放映,自然也就造成了电影时空上的延展放大。扩展时间的方法对细节的强化,时间的拉长、固定、静止。浓缩/省略时间的方法剪切镜头、字幕、空镜头、特技镜头、声音叙述。两个时空在光线上的设计是截然不同的。现实自然光,光比小/暖调多,过去戏剧光效,影调暗沉。10.1-有限的场景,无限的可能。...
2022-07-31 23:42:06
2800
原创 学习笔记:《视听语言》-8/9 镜头的后期编辑-中国大学慕课公开课
中国大学MOOC平台上线的中国传媒大学《视听语言》专属课程,将与你相约在春日,一起探索视听语言艺术的奥秘,快来加入我们吧!一个运动镜头要留起落幅,不能上来就运动,要静止->运动->静止。比如,要先拍特写,再拍近景,就还要再接中景和全景,会呈现一种次第退出的效果。比如,前一个镜头拍的是A的近景,那衔接的镜头应是隔着A的中景去拍全景。比如大特写——特写转场,大远景——空镜转场。全景->中景->近景->特写。9.2-蒙太奇的微观层次。9.3-蒙太奇的中观层次。9.4-蒙太奇的宏观层次。...
2022-07-30 00:25:19
1433
原创 学习笔记:《视听语言》-7/9 镜头创作的类型-中国大学慕课公开课
中国大学MOOC平台上线的中国传媒大学《视听语言》专属课程,将与你相约在春日,一起探索视听语言艺术的奥秘,快来加入我们吧!。固定镜头的外部画框是稳定的,所以构图样式上接近图片,注意表现固定镜头在内容捕捉上的审美性、精确性,如图片构图中的对称手法。固定镜头不是孤立的镜头形式,不能通过单镜头提供信息量,需要一个镜头组,所以每拍摄一个镜头都要考虑与前后镜头的关。运动镜头穿帮不可避免。因为固定镜头本身画框就是静止的,如果拍摄的内容是静止的,像是一个静止的图片。...
2022-07-29 17:55:50
3424
原创 学习笔记:《数字媒体技术概论》-6/10 游戏产业及游戏开发-中国大学慕课公开课
数字媒体技术概论,spContent=以数字媒体、网络技术与计算机技术相融合而产生的数字媒体技术,已经成为最热门的研究领域之一。如果你想了解数字媒体技术的奥妙,并想从事数字媒体技术相关的工作,请加入我们吧!让我们一起共同领略数字媒体技术的魅力,打下坚实的数字媒体技术基础。,中国大学MOOC(慕课)数字媒体技术概论_中国传媒大学_中国大学MOOC(慕课)6.3-游戏核心模块与开发团队。若笔记有误,恳请批评指正🥬。6.2-游戏产业现状概述。6.4-游戏引擎简介。......
2022-07-26 12:00:06
1389
2
原创 学习笔记:《数字媒体技术概论》-5/10 计算机图形与动画技术-中国大学慕课公开课
粗糙表面不同于光滑表面,其法矢量具有一个比较小的随机分量,可以在光滑表面上使它的法矢量进行扰动,然后可以有一定的随机分量,这样光线反射的时候会产生一个随机特征,使物体表面达到粗糙效果。饱和度对比在色彩三属性中以饱和度差异形成的对比。色彩的进退色彩不同,观察的时候会有不同的距离感。色彩的冷暖以紫色和绿色两个中性色为界,可以分为暖色系和冷色系,中性暖色和中性冷色用于配色的时候可以起到协调的作用。概念是工业界的一种颜色标准,通过对色相(H),饱和度(S),亮度(L)三个通道的叠加来获得各种各样的颜色。......
2022-07-26 10:36:12
1730
原创 学习笔记:《数字媒体技术概论》-4/10 数字语音信号处理技术及应用-中国大学慕课公开课
数字媒体技术概论,spContent=以数字媒体、网络技术与计算机技术相融合而产生的数字媒体技术,已经成为最热门的研究领域之一。如果你想了解数字媒体技术的奥妙,并想从事数字媒体技术相关的工作,请加入我们吧!让我们一起共同领略数字媒体技术的魅力,打下坚实的数字媒体技术基础。共振峰产生过程气流经过声道,声道受到激励而引起共振,使得一部分频率得到强化(产生了尖峰,即为共振峰),另一部分受到衰减。数字媒体技术概论_中国传媒大学_中国大学MOOC(慕课)4.4-声纹识别与语音合成。端到端(一整个神经网络)......
2022-07-25 12:08:57
814
原创 学习笔记:《数字媒体技术概论》-3/10 计算机视觉技术及应用-中国大学慕课公开课
计算机视觉信号处理理论与计算机出现后,人们试图用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程。➡️形成新兴的学科计算机视觉。数字图像二维图像,用有限数字数值像素的表示,用数组/矩阵表示,其光照位置和强度都是离散的数字图像是由模拟图像数字化得到的,以像素为基本元素,可以用数字计算机存储和处理的图像数字图像处理将图像信号转化为数字信号,并用计算机对其处理图像处理🆚计算机视觉图像处理人是最终解释者。............
2022-07-25 10:19:58
734
2
原创 中国大学慕课公开课-《视听语言》-学习笔记-6
选择斜侧拍摄的原因,运动物体与我们的被摄机位成90度夹角时,运动速度是最快的,带来极强的速度感。侧面角度如果不显示被摄对象的投射物,投射物和被摄对象不在一个画面内部解决时,侧面角度的选择会带来很强的悬念感,能够带引上下镜头之间的衔接,画面牵引。通常使用反侧角度是希望以被摄对象的方向牵引来拍摄投射物的主要内容-->回眸就带来了出其不意的效果,也就带来了有效的悬念意识。是机位与被摄对象垂直方向上的角度变化,指的是与被摄对象的情感关系。高度关系的选择角度关系的变化也会带来人物与背景关系的变化。...
2022-07-25 00:49:52
1175
原创 中国大学慕课公开课-《视听语言》-学习笔记-5
视听语言,spContent=想了解摄影发展历史上的趣事吗?想成为影像创作的高手吗?中国大学MOOC平台上线的中国传媒大学《视听语言》专属课程,将与你相约在春日,一起探索视听语言艺术的奥秘,快来加入我们吧!帮助主体揭示主题,实现内部完善的结构,进而实现单镜头叙事。单镜头叙事在一个镜头内部形成对一个事物的原因的探析。概念与主体有着紧密关系的对象,对画面内容的补充。视听语言_中国传媒大学_中国大学MOOC(慕课)主陪体间可以互换,但不可随意互换,会影响主题。渲染气氛,画面更加自然、更富有生活情趣。...
2022-07-24 14:45:45
746
原创 中国大学慕课公开课-《视听语言》-学习笔记-4
视听语言,spContent=想了解摄影发展历史上的趣事吗?想知道视听语言表达有哪些窍门吗?想成为影像创作的高手吗?中国大学MOOC平台上线的中国传媒大学《视听语言》专属课程,将与你相约在春日,一起探索视听语言艺术的奥秘,快来加入我们吧!,中国大学MOOC(慕课)视听语言_中国传媒大学_中国大学MOOC(慕课)若笔记存在错误,恳请批评指正。......
2022-07-24 10:42:13
536
原创 中国大学慕课公开课-《视听语言》-学习笔记-3
应用拍摄流水效果。水流时间长,延长曝光时间,补偿延长快门时间带来的曝光增加,通过收小光圈来获得同样曝光的量。比如光圈F2是F2.8的根号2倍,底面积即为2倍,则要保证曝光量一致,需将F2的快门时间缩短一半。4.1-正确曝光的标准。.........
2022-07-23 23:56:15
537
原创 学习笔记:《数字媒体技术概论》-1/10 数字媒体技术基础-中国大学慕课公开课
数字媒体技术概论,spContent=以数字媒体、网络技术与计算机技术相融合而产生的数字媒体技术,已经成为最热门的研究领域之一。如果你想了解数字媒体技术的奥妙,并想从事数字媒体技术相关的工作,请加入我们吧!让我们一起共同领略数字媒体技术的魅力,打下坚实的数字媒体技术基础。,中国大学MOOC(慕课)数字媒体技术概论_中国传媒大学_中国大学MOOC(慕课)若笔记📒存在记录错误,请批评指正!.........
2022-07-22 23:03:49
1820
原创 中国大学慕课公开课-《视听语言》-学习笔记-2
概念在快门打开的这段时间,物体没有任何运动,没有产生任何位移,能够记录下物体清晰的影像。通过2个不同的光学系统,形成2组影像,在调整镜头焦点时,这2组影像实现不同的距离的变化,从而控制影像清晰,如人像拍摄,通过影像的重叠从而实现影像的清晰拍摄。通过电动马达的转动,不再需要手旋转调焦环,通过马达的转动来调焦环,保证物体获得清晰的影像。位置在相机的最后部,面对着胶片/感光元件,胶片和感光元件所在的位置叫做焦点平面,快门的位置叫做焦点平面快门。轴线一般可分为哪三类?方向轴线,关系轴线,运动轴线。.........
2022-07-22 21:36:09
669
原创 中国大学慕课公开课-《视听语言》-学习笔记-1
主体范围不变,背景范围越来越小,背景物体越来越大-->焦距变长-->通过拍摄位置不断后退,焦距不断变长,实现主体范围不变/变小,背景物体越来越大的逆视觉原理效果(正常视觉效果近大远小)概念主体在拍摄过程中是清晰可见的,主体以前以后的一定范围内也是清晰可辨的,但是在这范围以外的物体就会呈现模糊虚化的状态。同等价位下,镜头焦距范围大,会牺牲影像质量和光圈==>定焦镜头,光圈更大,通过光线的量会更大;长焦距镜头更长的焦距,镜头的成像距离也会更长,单个镜头的口径也要变得更大。............
2022-07-22 18:36:19
814
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人