kaldi的I/O机制比较特殊,它是将特征、mfcc向量等保存在.ark文件中,通过.scp文件进行索引。为了方便分析,有时候需要将特征转换成numpy形式保存。最近在github上搜寻发现一个非常好用的python工具kaldiio,可以直接将ark转换成numpy array。
使用方式:
首先安装:
pip install kaldiio
从.ark文件到numpy array
import kaldiio
numpy_array = kaldiio.load_mat("xvector.ark:1453")
github项目地址:https://github.com/nttcslab-sp/kaldiio

本文介绍了一款名为kaldiio的python工具,该工具能够将kaldi的.ark文件直接转换为numpyarray,极大地方便了特征向量的处理与分析。通过简单的pip安装即可使用,对语音识别、信号处理等领域研究者尤其有用。
1526





