
HTK Tools
文章平均质量分 70
lv_xinmy
这个作者很懒,什么都没留下…
展开
-
HDMan命令
HDMan命令的主要功能是从多个输入生成发音字典。它支持在脚本中编辑命令行功能,就是可以按照定制好的方式生成发音字典。 每个编辑命令在脚本中都是单独的一行,如果HDMan命令没有任何的脚本编辑命令指定,该命令就将输入简单的排序并输出。每个输入字典文件都对应一个编辑命令脚本文件,如输入字典文件为example.dict,那么在指定的目录下可以存放编辑命令脚本文件example.d原创 2013-02-05 15:04:49 · 2155 阅读 · 6 评论 -
HTK数据准备工具-HLEd
HLEd工具是针对语音标签的处理工具,这个工具可以根据发音字典,将发音序列的描述文件自动标记成发音词典的发音序列。在HTK中使用MLF格式的文件来描述发音序列。一,基本用法HLEd [options] edCmdFile labFiles ..该命令执行完后,会对每一个labFile(语音标签文件)应用edCmdFile所指定的脚本文件,就是按照脚本文件指定的动作去处理每一个语音标签文原创 2013-02-17 16:27:38 · 6154 阅读 · 1 评论 -
HTK的使用方法
一,HTK目录结构htk是一个开源的软件,解压之后的目录如下:[root@localhost htk]# lsAUTHORS config.status env HTK HTKTools Makefile.inChangeLog config.sub FAQ HTKBook install-sh README原创 2013-02-17 15:04:25 · 7571 阅读 · 0 评论 -
HTK数据准备工具-HLStats
HLStats相对工具比较简单,主要是从输入的HMM列表和一系列的标签文件中进行统计工作,可以帮助我们分析声学训练的数据,也可以生成简单的语言模型,主要是二元语言模型。这个工具的主要功能如下:统计HMM列表中不同的音节出现的次数。统计HMM在标签文件中的最小、最大以及平均时长。计算二元语言模型。输出给定标签文件的所有被标记标签签列表。 一,实际例子语音识别时的识别单元都分别对应原创 2013-02-17 17:05:29 · 2288 阅读 · 0 评论 -
HTK数据准备工具-HCopy
HTK的数据准备工具主要是针对语言文件和语音标签数据文件的处理,前面介绍了处理语音标签数据文件的处理工具,如下:HLEd。根据发音词典,自动对标签文件进行标记。该工具还可以对标签文件进行编辑处理,其实主要是对标签文件进行编辑,按照发音词典进行扩展也是编辑的一种,另外可以对发音词典进行替换、删除、写入等编辑操作。参见:数据准备工具-HLEdHLStats。这个工具主要是对标签文件根据发音原创 2013-02-18 10:34:41 · 7753 阅读 · 2 评论 -
HTK数据文件的字节顺序交换
由于HTK很多工具都提供对二进制文件读写,如语音文件、MMF文件,HMM定义文件都可以定义为二进制文件,这样就可能会出现字节顺序在不同的机器上不一致的问题。为了避免这个字节序不同而在不同机器上不兼容的问题,HTK的二进制都统一默认使用大端,如果需要改变这个默认的设置,可以使用下面两个选项NATURALWRITEORDER。NATURALREADORDER。如果设置了这两个选原创 2013-03-06 12:42:11 · 1598 阅读 · 1 评论 -
HTK语音信号处理-帧序列
本文假设所处理的语音输入格式是WAVEFORM(SOURCEKIND的值设置),由HTK库中HWave库提供处理支持,对于其它的格式,基本也是相通的。从原始语音到最后的特征向量(如MFCC)文件需要经过原始语音->预加重->分帧->加窗处理->快速傅里叶转换->滤波组处理->离散余弦转换(计算倒谱参数)->对数能量->差量倒谱参数(向量的形式了)->MFCC特征本文只完成对预加重、分帧及加原创 2013-02-26 12:34:55 · 2419 阅读 · 0 评论 -
HTK数据准备工具-HList
HTK在数据准备工具是主要是处理标签标记数据和音频数据,HCopy工具可以将音频数据转换成HTK的特征文件数据(参见 数据准备HCopy),HList并不处理什么数据,从字面意思就可以知道,这是一个查看工具,也非常有用一,功能查看所有HTK支持的格式文件的内容,可以支持多个文件。二,语法HList [options] file ....这个命令会输出file的文件内容,原创 2013-02-18 11:05:31 · 3135 阅读 · 0 评论