本实验是利用HTK来搭建了一个数字语音识别系统,主要参考了苏统华的《应用HTK搭建语音拨号系统》,但是因为还是在实验中遇到了一些问题,所以希望能够把出现的问题拿出来,与大家分享。
整个系统分为四大部分,共有11步组成:
(一)数据准备
step1 : the Task Grammar
step2 : the Dictionary
step3 : Recording the Da
step4 : Creating the Transcription Files
step5 : Coding the Da
(二) 建立单声道的HMM模型
step6 : Creating Flat Start Monophone
step7 : Fixing the Silence Models
step8 : Realigning the Training Da
(三)创建绑定状态的三音素HMM模型
step9 : Making Triphones from Monophones
step10 : Making Tied-State Triphones
(四)识别器的评估
step11 : Recognising the Test Da