kaldi文件查看命令

本文介绍了Kaldi中多种格式文件的查看方法,包括ark、scp文件,fst文件,mfcc生成的文件,mdl文件,tree文件,ali.1.gz对齐文件等,还提及查看transition和叶子节点个数的操作,为处理Kaldi相关文件提供了实用指导。

1.  ark,scp文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark,t:-|head

ark存的试二进制文件,scp可以直接用cat命令看。

* 2.  fst文件

~/kaldi/tools/openfst-1.6.2/bin/fstprint L.fst | head -n 10 

~/kaldi/tools/openfst-1.6.2/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst | head -n 15

fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps  |  ps2pdf – L.pdf

~/kaldi/tools/openfst-1.6.2/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst

* 3.  mfcc 生成的文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_test_hires.1.ark ark,t:- | head

在文件前边加ark关键字,告诉copy-feats是什么格式的,还有后面加一个ark,t:- 表示输出格式为t文本,否则默认是二进制。

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark:- |~/kaldi/src/featbin/add-deltas ark:- ark,t:- | head 

这样可以看到40维的数据

* 4.  mdl文件

~/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl - 

* 5.  tree文件

~/kaldi/src/bin/copy-tree --binary=false tree -

~/kaldi/src/bin/draw-tree ../../data/lang/phones.txt tree | dot -Gsize=50,100 -Tps|ps2pdf - tree.pdf

* 6.ali.1.gz 对齐文件

~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:- |head -n 1

可以先解压 gunzip ali.1.gz

然后  ~/kaldi/src/bin/show-alignments ../../data/lang/phones.txt 40.mdl ark:ali.1 |head -n 2

7. 查看transition

show-transitions phones.txt final.mdl > transition.txt

8. 查看叶子节点个数:

tree-info tree |grep num-pdfs|awk '{print $2}'

 


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值