11、富有表现力的语音语料库的客观与主观评估及线性和非线性预测残差信号在说话人识别中的应用

语音语料库评估与残差信号在说话人识别中的应用

富有表现力的语音语料库的客观与主观评估及线性和非线性预测残差信号在说话人识别中的应用

在语音处理和识别领域,对语音语料库的评估以及不同预测残差信号在说话人识别中的应用是重要的研究方向。下面将详细介绍相关的评估方法、实验设置、结果分析等内容。

富有表现力的语音语料库评估
  • 客观评估

    • 数据集与算法表现 :对十个测试数据集进行了识别率的评估。不同算法在不同数据集上表现各异。基于遗传算法(GA)的降维对系统有一定帮助,但与 Data1L 和 Data1LC 的差异较小。部分算法(如 J48、IB1 和 IBk)在经过两次连续降维(无二阶导数和后续 GA 降维)生成的数据集上表现更好。还有一些算法在去除 F0 和能量的线性/对数冗余时效果更佳。此外,增强版本的算法相比其对应算法显著提高了结果。
    • 数据集影响 :Data1LC 与 Data1G 和 Data1L 取得了几乎相同的结果,但参数减少了一半以上。去除时序参数(Data1N 和 Data1NG)时,结果略有损失;仅在重读音节上计算参数(Data1LS 和 Data2LS)时,结果显著变差。
    • 混淆矩阵 :Data2G 实现了最佳的平均识别率(97.02% ± 1.23),其平均混淆矩阵如下:
      | | Agr | Hap | Sad | Neu | Sen |
      | — | — | — | — | — | — |
      | AGR | 99.1% | 0.8% | 0.1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值