语音情感识别与卷积神经网络模型压缩技术解析
语音情感识别的实验分析
在语音情感识别领域,为了评估不同方法的有效性,研究人员使用了两个不同的情感语音数据库进行实验。一个数据库中的语音由客服中心的专业人员表演录制,另一个则是由业余演员完成。
实验中计算了使用原始和改进的相对小波包能量与熵数据进行情感识别的平均准确率。从自然和 BES 数据库的实验结果来看,KNN 和 ELM 核分类器在识别情感方面表现出色。具体而言,在所有“db”小波阶数下,ELM 核在平均情感识别率上超越了 KNN 分类器。
| 分类器 | 原始相对小波包属性准确率 | 改进相对小波包属性准确率 |
|---|---|---|
| ELM 核分类器 | 68% | 96% |
| KNN 分类器 | - | - |
在说话人无关的试验中,使用原始和改进版本的相对小波包能量和熵特征时,最高平均情感识别率分别为 58.01%和 96.74%。KNN 分类器在说话人相关实验中的最高平均识别率为 58.61%,在说话人无关试验中为 48.09%。ELM 核的平均情感识别得分(58.33%)高于 KNN 分类器(50.31%)。在无人类说话者参与的研究中,ELM 核和 KNN 分类器的最高情感识别率分别为 31.46%和 28.75%。
超级会员免费看
订阅专栏 解锁全文
886

被折叠的 条评论
为什么被折叠?



