自动语音识别混合模型与基于语音特征的隐马尔可夫模型探索
自动语音识别(ASR)领域一直是研究的热点,近年来,多种技术和模型不断涌现,以提高识别的准确性和鲁棒性。本文将介绍两种不同的研究方向,一是混合模型在自动语音识别中的应用,二是如何将语音特征融入隐马尔可夫模型(HMM)的ASR系统。
混合模型在自动语音识别中的应用
支持向量机(SVM)分类器在多个领域的成功应用引起了ASR领域研究人员的关注。早期将SVM用于连续数字识别的尝试催生了混合SVM/HMM系统,这与过去十年提出的基于人工神经网络(ANN)的混合系统类似。因此,比较这两种类型系统的性能变得十分重要。此外,由于ASR系统的鲁棒性是当前的一个开放问题,所以需要在嘈杂环境中对混合系统进行比较评估。
- 实验限制与结果 :实验中使用的SVM软件需要将核矩阵保存在内存中,这限制了SVM/HMM训练数据集的大小。为了进行公平比较,混合ANN/HMM也使用了相同的小训练子集。结果表明,混合ANN/HMM系统在所有考虑的噪声类型和信噪比(SNR)值下,都比作为参考的基于HMM的系统提供了略好的结果;而混合SVM/HMM系统的性能略低于基于HMM的系统。
- 系统优势与改进方向 :使用子音素单元的混合ANN/HMM系统具有竞争力。虽然混合SVM/HMM系统的设计仍处于初步阶段,但已达到了合理的性能水平。特别是,其训练中使用的最大间隔原则在嘈杂环境中可能会产生重要影响。为了进一步提高性能,需要解决一些问题,例如增加训练样本、在特征向量中添加更广泛的时间上下文以及选择合适的特征集。此外,混合系统更适合使用不符合HMM独立性限制的不同类型
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



