如何用kaldi训练好的DNN模型做在线识别

本文介绍了在已有Kaldi训练的DNN模型基础上,如何应对不同情况下的在线语音识别任务。包括使用新语言模型、新字典和完全重新训练的情况。

在已经训练好模型的情况下,需要针对一个新任务做在线识别应该怎么做呢?

一种情况是,用已有的声学模型和新训练的语言模型。

语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN声学模型一起来进行识别的。
SRILM可以用来训练ARPA格式的LM,假设train.txt是语料,wordlist是词汇,假设语言模型的字典和识别器的字典一样,可以按如下办法训练LM
ngram-count -text train.txt -order 3 -limit-vocab -vocab wordlist -unk \
  -map-unk "<unk>" -kndiscount -interpolate -lm srilm.o3g.kn.gz

然后通过下面的命令将ARPA格式的LM转化成WFST格式
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值