Kaldi AMI数据集脚本学习3---run_ihm.sh stage 1~3

该博客详细介绍了如何使用Kaldi的run_ihm.sh脚本来处理AMI数据集,包括stage 1的准备工作,如整理wav.scp文件和复制关键文件;stage 2的计算说话人特定的 cepstral 均方根统计;以及stage 3的相关操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. stage 1

      在此之前,已经下载了130G的AMI数据在目录$AMI_DIR(wav_db/amicorpus)了。

# Prepare ihm data directories,
if [ $stage -le 1 ]; then
  local/ami_ihm_data_prep.sh $AMI_DIR
  local/ami_ihm_scoring_data_prep.sh $AMI_DIR dev
  local/ami_ihm_scoring_data_prep.sh $AMI_DIR eval
fi
       ami_ihm_data_pre.sh脚本内部流程如下:

       1) 在data/local/ihm/train文件夹下准备各种文件,如wav.scp;

       2) 拷贝spk2utt utt2spk wav.scp text segments reco2file_and_channeldata/ihm/train文件夹中。

       3) 检查文件格式:       

utils/validate_data_dir.sh --no-feats data/ihm/train || exit 1;
    &n
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值