1、下载timit数据,将数据解压在egs/timit/data 目录下
2、打开s5目录,编辑run.sh 如下(根据timit数据存放的目录修改):
echo ============================================================================
echo " Data & Lexicon & Language Preparation "
echo ============================================================================
#timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT # @JHU
timit=/home/kaldi/egs/timit/data/TIMIT
3 、打开s5目录,编辑cmd.sh. 如下:()
export train_cmd=run.pl
export decode_cmd=run.pl
export mkgraph_cmd=run.pl
export cuda_cmd=run.pl
4、运行 run.sh, 在exp目录下生成 单音素、双音素、三音素等目录。
![]()
5、进入想要测试的目录,找到三个文件:HCLG.fst final.md

这篇博客详细介绍了如何使用Kaldi运行TIMIT数据集进行语音识别。首先下载并解压TIMIT数据,然后编辑s5目录下的run.sh和cmd.sh文件,设置正确路径。接着,运行run.sh生成模型,将模型文件复制到online_demo目录,调整online_demo的run.sh文件以匹配模型和数据路径。最后,运行run.sh进行语音识别。其他如mini_librispeech和thchs30的运行过程类似。
最低0.47元/天 解锁文章
322





