kaldi声学模型训练,首先需要数据准备,
在数据准备阶段需要准备标注数据的发音,处理步骤如下:
1.首先是把训练数据和测试数据对应的标注(text)合成一个文件到text_all,同时去掉其他非字母和数字的字符串
cat $traindatadir/text$testdatadir/text| perl -pe"s/^[\w\-]+\s+//
kaldi声学模型训练,首先需要数据准备,
在数据准备阶段需要准备标注数据的发音,处理步骤如下:
1.首先是把训练数据和测试数据对应的标注(text)合成一个文件到text_all,同时去掉其他非字母和数字的字符串
cat $traindatadir/text$testdatadir/text| perl -pe"s/^[\w\-]+\s+//