语音特征变换与识别技术研究
在语音处理领域,特征变换和识别技术一直是研究的重点。有效的特征变换能够提取出更具区分性的信息,提升语音识别系统的性能,尤其是在复杂环境下的表现。下面将为大家详细介绍两种相关的技术方法。
基于流形学习的特征变换
在语音分类任务中,常常会使用到特征变换方法,以提高分类的准确性。这里介绍了几种不同的特征变换方法,并对它们的性能进行了比较。
-
实验方法 :
- 使用了26维的MFCC + Δ向量作为高维输入,应用到三种降维方法中,即PCA、Isomap和LLE。
- 对比了这些方法输出的特征以及原始的MFCC + Δ向量在语音分类任务中的表现。
-
实验结果 :
- 从实验结果来看,这些结果与使用静态特征时非常相似。在低维度下,流形学习方法(Isomap和LLE)比MFCC + Δ和PCA派生的特征表现更优。
- 其中,Isomap在大部分分类测试中表现最佳,在图4所示的分类测试中,有74.36%的测试中优于其他特征类型。
- 在训练集上的分类性能也与静态特征结果一致。
以下是不同特征变换方法在低维度下的性能对比表格:
| 特征类型 | 低维度分类性能 |
| ---- | ---- |
| MFCC | 相对较差 |
| PCA | 一般 |
| Iso
语音特征变换与识别技术综述
超级会员免费看
订阅专栏 解锁全文
977

被折叠的 条评论
为什么被折叠?



