Kaldi IO机制的一些概念及代码流程解析

本文详细介绍了Kaldi中的Ark和Scp文件的概念及其在处理音频特征时的作用。Ark文件用于存储二进制数据,如特征文件,而Scp文件则包含文本数据,通常为人可读。在Kaldi中,rspecifier和wspecifier用于指定输入和输出。Ark文件的读取和写入涉及SequentialTableReader和TableWriter类,同时支持通过管道进行数据流处理。例如,`compute-fbank-feats`命令读取wav.1.scp并输出到out.ark,而`copy-feats`则从out.ark复制数据到新的ark和scp文件。在管道操作中,`|`符号用于连接命令,实现数据的流转。

1、ark,scp概念

1.1 基本概念

  • ark : 代表以二进制方式读或写文件,archive文件,该文件一般是特征文件或人类不可读的文件。
  • scp: 代表以文本方式读或写文件,scp文件,一般人类可读。
  • Kaldi读取或写文件由对应可执行程序参数的ark/scp位置决定,此处有rspecifier和wspecifier两个概念,分别对应输入及输出。执行程序时,命令参数中首先出现的是rspecifier,后出现的是wspecifier。

在这里插入图片描述

 //读取wav.1.scp文件,输出写入到out.ark文件中
compute-fbank-feats  --verbose=2 --config=fbank.conf scp,p:wav.1.scp ark:out.ark     

1.2 、参数选项

1.2.1、输出时选项(wspecifier)

在这里插入图片描述

1.2.2、读取时选项(rspecifier)
  • (once):由用户指定随机访问方式下对每个key只获取一次。
  • p(permissive): 指导程序忽略读取文件时遇到的错误。在读取损坏的scp文件时程序的Haskey查询返回false,读取损坏或截断的archive文件时。该标志会阻止异常抛出。
  • s(sorted): 告诉程序读取文件时key是排好序的。
  • cs(called-sorted): 告诉程序HasKey函数及Value函数的调用是有序的。

在这里插入图片描述

1.2.3 管道’|'标志含义

以以下例子作为解析

nnet3-latgen-faster-parallel --num-threads=4 --frame-subsamp
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值