29、语音情感识别与增强技术研究

语音情感识别与增强技术研究

1. 语音情感识别模型ADGCN

1.1 模型设计思路

为了提取有意义的话语内信息,设计了一个适用于基于自监督学习(SSL)的预训练模型Data2vec的适配器。可视化结果证明,预训练模型确实带来了突破。不过,适配器提取的话语内信息无法完全满足实际需求。

对于话语间上下文信息的建模,提出了自适应动态图卷积网络(ADGCN),并引入了两种残差机制:自适应输出残差(AOR)和动态层残差(DLR)。这两种残差部分确保了在充分提取局部和全局话语间上下文信息的同时,不会出现过平滑问题。

1.2 模型性能表现

与当前的话语内方法和话语间方法相比,提出的ADGCN模型在加权准确率(WA)、无加权准确率(UA)和F1分数上分别达到了76.79%、76.20%和76.43%,绝对增量分别超过了4.03%、7.02%和5.05%。提供的混淆矩阵显示,该模型对四种情感类型都具有较高的敏感性。

模型 WA UA F1分数
ADGCN 76.79% 76.20% 76.43%
其他模型 - - -
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值