kaldi中文语音识别_基于thchs30(6)

本文档介绍了在Kaldi中进行中文语音识别时遇到的Python环境问题及解决方案,包括升级Python至3.x版本、编译安装Kaldi以及在compute-mfcc-feats和copy-feats中观察参数。通过分析log日志和生成的ark、scp文件,理解了这两个工具在特征提取过程中的作用,并展示了如何单独运行它们以生成所需文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

接上回,其实上回我们在make_mfcc.sh中提取特性

$cmd JOB=1:$nj $logdir/make_mfcc_${name}.JOB.log \
    compute-mfcc-feats  $vtln_opts --verbose=2 --config=$mfcc_config \
     scp,p:$logdir/wav_${name}.JOB.scp ark:- \| \
      copy-feats $write_num_frames_opt --compress=$compress ark:- \
      ark,scp:$mfccdir/raw_mfcc_$name.JOB.ark,$mfccdir/raw_mfcc_$name.JOB.scp \
      || exit 1;

在执行这段出现的问题都是因为python环境没有安装好,目前通过升级python为python3版本之后,进行kaldi的编译,后再次执行提取特性是成功的,也就是按照下面这篇文章先进行python的升级和编译安装kaldi
centos7编译安装kaldi,链接是:https://blog.youkuaiyun.com/zeratyl/article/details/78646818

我们在编译之前,在kaldi/src/featbin下的compute-mfcc-feats.cc中加入如下打印信息

用于观测compute-mfcc-feats 调用时的参数
然后我们编译kald

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值