Kaldi-Timit 训练

本文详细介绍使用Kaldi工具和Timit数据集进行语音识别模型训练的过程,包括数据集介绍、训练步骤及常见问题解决方法。

Kaldi-Timit 训练

背景

  • 这篇博客主要记录使用KaldiTimit数据集训练模型的过程以及遇到的问题及解决方法。

Timit数据介绍

  • 制作方

    • Timit是几个研究机构联合收集的,文本材料由Massachusetts Institude of Technology(MIT)、Stanford Research Institude(SRI)和Texas Instruments(TI)共同完成;语音录制在TI完成,转录(包括维护和校验)在MIT完成。
  • Corpus Speaker Distribution

    • Timit一共包含6300个句子,由来自美国8个主要州的630个人,每个人说10句话得到,详细情况如下表:

      州号(dr)男性人数(#Male)女性人数(#Female)总人数(Total)
      dr1 (New England)31(63%)18(37%)49(8%)
      dr2 (Northern)71(70%)31(30%)102(16%)
      dr3 (North Midland)79(67%)23(23%)102(16%)
      dr4 (South Midland)69(69%)31(31%)100(16%)
      dr5 (Southern)62(63%)36(37%)98(16%)
      dr6 (New Yourk City)30(65%)16(35%)46(7%)
      dr7 (Western)74(74%)26(26%)100(16%)
      dr8 (Army Brat)22(67%)11(33%)33(5%)
      total438(70%)192(30%)630(100%)
  • Corpus Text Material

    • 详细情况如下表:

      句子类型(Sentence Type)句子数量(#Sentences)说话人数(#Speakers)总人数(Total)句/人(#Sentences/Speaker)
      方言(SA)263012602
      音素紧凑型(SX)450731505
      音素分散型(SI)1890118903
      总数(Total)2342-630010
    • SA类型主要针对同一音素在不同方言中的发音;SX类型的目的在于尽可能的覆盖多的音素对;SI类型是从Brown Corpus中选取的,目的在于增加句子的多样性。

  • Training/Test Subdivision

    • 核心测试集包含24个speaker,每个州2个男性1个女性,每个人3句SI型句子和5句SX型句子;完整测试集包含168个人,没人8句SX型句子。详细情况如下表:

      测试集类型人数句子/人句子数
      核心测试集248(3SI + 5SX)192
      完整测试集1688(SX)1344
  • 文件类型
    .wav : SPHERS 格式语音文件
    .txt : 音频转录文本
    .wrd : 带有时间标记的转录文件
    .phn : 带有时间标记的音素转录文件
    如下图所示:
    这里写图片描述

过程

  • Timit数据准备
    • 注意: Timit数据集不可以免费获取,通过交钱或者加入LDC会员才可以获取数据集。以下假设已经获得Timit数据集。
  • 步骤如下:
    1. 进入kaldi/egs/timit/s5, 创建data目录, 用于存放timit数据;
    2. 将timit数据复制到data目录下,复制完后的目录为data/timit/ ;
    3. 修改s5目录下run.sh里timit的路径,在s5目录下执行run.sh即可,整个过程要几个小时;
    这里写图片描述

问题及解决方法

  • 问题一
    这里写图片描述
    从错误信息可以知道qsub没有安装(或者不在搜索路径中),安装qsub,重新执行

  • 问题二
    这里写图片描述

    这种情况多半是电脑没有使用GridEngine,这是需要修改s5目录下的cmd.sh中的变量,如下图:
    这里写图片描述

参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值