语音情感识别与普通话附加疑问句韵律特征研究
在语音处理和语言学研究领域,语音情感识别(SER)以及普通话句子的韵律特征一直是备受关注的话题。本文将为大家介绍两项相关研究,一项是关于语音情感识别的时频注意力机制,另一项是对普通话附加疑问句韵律特征的探究。
语音情感识别的时频注意力机制
在语音情感识别任务中,研究人员提出了一种时频注意力机制(TF - A)。为了更好地利用语音中的音素信息和性别信息,他们设计了针对时间和频率的两种不同注意力模块。同时,采用了类似多任务学习的结构,构建了一个额外的网络分支来获取仅包含简单性别指示的领域信息。
为了验证该机制的性能,研究人员进行了一系列实验,并与现有的模型进行了对比。以下是不同模型在准确率(WA和UA)和F1分数上的对比情况:
| 模型 | WA | UA |
|---|---|---|
| LSTM - ELM [20] | 62.85% | 63.89% |
| CNN - Att [12] | 70.18% | 66.38% |
| DED [26] | 69.0% | 70.1% |
| NAS [23] | 70.54% | <
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



