说话人识别与感知器类验证技术解析
1. 说话人识别系统组合分析
在说话人识别领域,不同系统的组合表现各异。当将Speaker - SVM系统与Basic - GMM组合时,能获得一定的性能提升,但Speaker - SVM和SRI - GMM系统的组合却没有显著的改进。
在训练和测试数据的匹配与不匹配条件方面,对于Tandem/HATS - GMM和Speaker - SVM系统,以及它们与Basic - GMM和SRI - GMM的分数级组合,有如下表现:
| 组合情况 | 匹配条件 | 不匹配条件 |
| — | — | — |
| Tandem/HATS - GMM与Basic - GMM组合 | 有提升 | 提升更明显 |
| Speaker - SVM与Basic - GMM组合 | 有提升 | 提升更明显 |
| Tandem/HATS - GMM与SRI - GMM组合 | 影响较小 | 影响较小 |
| Speaker - SVM与SRI - GMM组合 | 影响较小 | 影响较小 |
从上述表格可以看出,在与Basic - GMM进行分数级融合时,Tandem/HATS - GMM和Speaker - SVM在匹配和不匹配条件下都有增益,尤其是不匹配条件下。而对于SRI - GMM基线,与Tandem/HATS - GMM和Speaker - SVM系统的组合在匹配或不匹配情况下影响都不大。
2. 语音特征在说话人识别中的应用
首次将语音Tandem/HATS - MLP特征应用于说话人识别任务。尽管该特征最初是为自动语音识别(ASR)开发的,但在高斯混合模型
超级会员免费看
订阅专栏 解锁全文
701

被折叠的 条评论
为什么被折叠?



