提升普通话声调识别准确率的混合方法
在普通话学习和教学中,声调识别的准确性至关重要。本文将介绍一种结合强制对齐声调模型和竞争模型声调评估的方法,以提高普通话声调识别的准确率,并通过实验验证其有效性。
1. 提出的方法
为了提高普通话声调识别的准确性,我们提出了一种结合强制对齐声调模型和竞争模型声调评估的方法。该方法主要包括以下几个步骤:
- 使用基于HMM的强制对齐进行分割预处理 :分割准确性对于声调评估至关重要,因此首先对输入语音进行初始分割。
- 基于强制对齐的声调模型 :对训练样本进行分类,提取声调特征。
- 基于竞争模型的声调评估 :通过构建竞争模型,对声调进行评估。
1.1 使用基于HMM的强制对齐进行分割预处理
分割准确性越高,评估效果越好。因此,在进行声调评估之前,我们使用基于HMM的强制对齐对输入语音进行初始分割。具体步骤如下:
- 构建声学模型 :使用863普通话语料库构建HMM强制对齐的声学模型,该模型基于上下文相关的三音子建模,声学特征为39维Mel频率倒谱系数(MFCC)声调模型。
- 提取MFCC参数 :将输入语音波形提取为39维MFCC参数。
- 进行强制对齐 :使用Viterbi算法进行强制对齐,将每个输入语音分割成多个声调音节。
以中文句子“偶然的机会”为例,图3.2展示了使用基于HMM的强制对齐进行初始分割的结果,图3.
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



