
中文识别
52Babara
苦逼的程序猿,不过听着歌打点代码挺好。
展开
-
kaldi中文语音识别_基于thchs30(1)
首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr, 将thchs30中的三个压缩包下载后放到kaldi/egs/thchs30 同级目录修改s5/run.sh里面的语音库路径 thchs30=......原创 2018-05-09 19:37:26 · 4755 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(7)
接上回,mfcc特征咱们暂时看完了,总结一下,此处引用别人的分析:特征提取MFCCcompute-mfcc-feats.ccCreate MFCC feature files.Usage: compute-mfcc-feats [options...] <wav-rspecifier> <feats-wspecifier>其中参数rspecif...原创 2018-08-22 17:42:45 · 3361 阅读 · 0 评论 -
kaldi中文语音识别_基于thchs30(8)
接上回,我们继续看run.sh#copy feats and cmvn to test.ph, avoid duplicated mfcc & cmvn #拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvncp data/mfcc/test/feats.scp data/mfcc/test_phone && cp data/mfcc/test/cm...原创 2018-09-07 13:36:32 · 3176 阅读 · 7 评论 -
kaldi中文语音识别_基于thchs30(6)
接上回,其实上回我们在make_mfcc.sh中提取特性$cmd JOB=1:$nj $logdir/make_mfcc_${name}.JOB.log \ compute-mfcc-feats $vtln_opts --verbose=2 --config=$mfcc_config \ scp,p:$logdir/wav_${name}.JOB.scp ark:- \| ...原创 2018-08-20 10:18:14 · 2511 阅读 · 4 评论 -
语音识别基础知识及概念
转载 2018-08-10 18:58:51 · 1636 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(5)
接上回if [ -f $data/segments ]; then #这里是查看data/mfcc/train下是否存在segments,如果存在则执行then后面的脚本,否则执行else后面的,这个文件不存在,所以之后调用else后面的处理 echo "$0 [info]: segments file exists: using that." split_segments="" for...原创 2018-05-23 17:37:37 · 6803 阅读 · 3 评论 -
kaldi中文语音识别_基于thchs30(4)
接上回,完成数据准备的工作后,shell显示说明已经创建这些文件完毕。 我们看到生成的spk2utt的文件格式是这样的:我们看到它是先是一个说话者id号 然后是这个说话者id下的所有名称,而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了,所以在下次运行run.sh时, 先注释掉相关数据准备的shell脚本。#data prep...原创 2018-05-16 14:08:47 · 4911 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(3)
接上回,我们继续看run.sh#you can obtain the database by uncommting the following lines#[ -d $thchs ] || mkdir -p $thchs || exit 1#echo "downloading THCHS30 at $thchs ..."#local/download_and_untar.sh $thchs h...原创 2018-05-14 17:17:57 · 3722 阅读 · 3 评论 -
kaldi中文语音识别_基于thchs30(2)
接上回,我们需要修改cmd.sh. 如下:原创 2018-05-10 11:08:09 · 4288 阅读 · 1 评论