18、语音检测与校准方法研究

语音检测与校准方法研究

1. 虚假语音检测研究

虚假语音检测在当今信息安全领域愈发重要。为了更有效地检测虚假语音,研究人员引入了新特征——残余调制频谱图。

1.1 实验数据集与结果

实验使用了多个数据集,包括CMU Arctic数据集、LJ Speech数据集和LibriTTS数据集,并采用得分级组合模型进行训练。以下是不同数据集训练和测试时的准确率(Accuracy)和等错误率(EER):
| Train / Test | CMU Arctic | | LibriTTS | | LJ Speech | |
| — | — | — | — | — | — | — |
| | Accuracy (%) | EER (%) | Accuracy (%) | EER (%) | Accuracy (%) | EER (%) |
| CMU Arctic | 96.67 | 2.22 | 83 | 11.90 | 54.08 | 44.90 |
| LibriTTS | 90 | 11.11 | 98.8 | 2.38 | 63.26 | 0 |
| LJ Speech | 56.67 | 24.44 | 97.6 | 4.76 | 100 | 0 |

从这些数据中可以看出,不同数据集在训练和测试时的表现差异较大。例如,以CMU Arctic数据集训练的模型,在测试时使用相同数据集的准确率高达96.67%,而在LJ Speech数据集上测试时准确率仅为54.08%。

1.2 特征性能分析

残余调制频谱图和调制频谱图在不同场景下表现不同:
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值