kaldi跑自己数据遇到的问题合集(持续更)

这篇博客汇总了在使用Kaldi进行语音识别时遇到的常见问题,包括SRILM训练语言模型失败、特征提取过程中的cc:174错误以及Python版本引起的AttributeError。针对这些问题,提供了详细的解决步骤,如调整SRILM命令、转换音频格式至16bit,16000Hz采样率以及处理Python3中字符串解码问题。" 21606235,276621,信息熵与相关性:条件熵、联合熵、左右熵和互信息解析,"['信息熵', '条件熵', '互信息', '自然语言处理']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

**1.**SRILM训练语言模型结果出不来

网络上:
http://www.mamicode.com/info-detail-1944347.html
https://blog.youkuaiyun.com/u011500062/article/details/50780935

下面说一下,如果网上的方法训练不出语言模型,可考虑我说的方法(直接在srilm文件下输入下面的命令):

1.统计语料库生成n-gram统计文件
./bin/i686-m64/ngram-count-text text.txt -roder 3 -write yy.count #词频统计
2.生成语言模型
./bin/i686-m64/ngram-count -read yy.count -order 3 -lm word-3gram.lm -interpolate -kndiscount #训练三音子模型

**2.**特征提取过程中出现cc:174错误

steps/make_mfcc.sh --nj 8 --cmd run.pl data/mfcc/train exp/make_mfcc/train mfcc/train
utils/validate_data_dir.sh: Successfully validated data-directory data/mfcc/train
steps/m

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值