语音检测与校准方法研究
1. 虚假语音检测研究
虚假语音检测在当今信息安全领域愈发重要。为了更有效地检测虚假语音,研究人员引入了新特征——残余调制频谱图。
1.1 实验数据集与结果
实验使用了多个数据集,包括CMU Arctic数据集、LJ Speech数据集和LibriTTS数据集,并采用得分级组合模型进行训练。以下是不同数据集训练和测试时的准确率(Accuracy)和等错误率(EER):
| Train / Test | CMU Arctic | | LibriTTS | | LJ Speech | |
| — | — | — | — | — | — | — |
| | Accuracy (%) | EER (%) | Accuracy (%) | EER (%) | Accuracy (%) | EER (%) |
| CMU Arctic | 96.67 | 2.22 | 83 | 11.90 | 54.08 | 44.90 |
| LibriTTS | 90 | 11.11 | 98.8 | 2.38 | 63.26 | 0 |
| LJ Speech | 56.67 | 24.44 | 97.6 | 4.76 | 100 | 0 |
从这些数据中可以看出,不同数据集在训练和测试时的表现差异较大。例如,以CMU Arctic数据集训练的模型,在测试时使用相同数据集的准确率高达96.67%,而在LJ Speech数据集上测试时准确率仅为54.08%。
1.2 特征性能分析
残余调制频谱图和调制频谱图在不同场景下表现不同:
-
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



