导语:kaldi中的ark,scp,fst,mdl,gz,tree等文件不能直接以head或者vim的方法查看,需要指定查看命令。下面总结了几种常用的快捷查看方法,方便读者阅读源码。
ark,scp文件
~/kaldi/src/featbin/copy-feats ark:[目标_]ark ark,t:-|head
ark存的试二进制文件,scp可以直接用cat vim命令查看。
fst文件
~/kaldi/tools/openfst-版本号/bin/fstprint L[_目标].fst | head -n 10
~/kaldi/tools/openfst-版本号/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst | head -n 15
fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps | ps2pdf – L.pdf
~/kaldi/tools/openfst-版本号/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst
mfcc 生成的文件
~/kaldi/src/featbin/copy-feats ark:[目标_]ark ark,t:- | head
在文件前边加ark关键字,告诉copy-feats是什么格式的,还有后面加一个ark,t:- 表示输出格式为t文本,否则默认是二进制。~/kaldi/src/featbin/copy-feats ark:[目标_]ark ark:- |~/kaldi/src/featbin/add-deltas ark:- ark,t:- | head
这样可以看到维度的数据
mdl文件~/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl -
tree文件
~/kaldi/src/bin/copy-tree --binary=false tree -
~/kaldi/src/bin/draw-tree ../../data/lang/phones.txt tree | dot -Gsize=50,100 -Tps|ps2pdf - tree.pdf
ali.1.gz 对齐文件
~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:- |head -n 1
先解压 gunzip ali.1.gz
然后 ~/kaldi/src/bin/show-alignments ../../data/lang/phones.txt 40.mdl ark:ali.1 |head -n 2