Kaldi的安装与编译请参考:Kaldi的安装与编译
Kaldi的例子有很多,在egs目录下面,对Kaldi不熟悉的小白们可以先从yesno和timit两个例子入手,这样可以对Kaldi有个直观的认识。
一、运行yesno实例
该实例是一个非常小的数据集,每一条记录都是一系列yes或者no的语音,标注是由文件名来标注的。先运行一下。
切换到./egs/yesno/s5目录下,运行sudo./run.sh命令。
经过一段时间的训练和测试,可以看到运行结果。
WER为0.00。看来这个例子识别的还是挺准的。
PS:WER(WordError Rate)是字错误率,是一个衡量语音识别系统的准确程度的度量。其计算公式是 WER= ( I + D+ S

本文介绍了Kaldi中yesno和timit两个实例的运行过程。yesno是一个小型数据集,通过运行./egs/yesno/s5/run.sh得到0.00的WER。timit实例则涉及LDC的TIMIT语料库,但需要自行准备数据并调整脚本以适应单机运行。在运行过程中可能遇到irstlm相关错误,需安装并配置irstlm工具。
最低0.47元/天 解锁文章
4066

被折叠的 条评论
为什么被折叠?



