
语音识别
零落_World
https://github.com/cdj0311
展开
-
HTK搭建大词汇量连续语音识别系统(二)
接着昨天的做。昨天有个没注意的地方需要改过来,timit发音文件每个发音最后不能有sp,否则dict1会有两个sp。六、提取特征参数,生成.mfc文件 编写配置文件wav_config,内容如下: SOURCEFORMAT=NISTTARGETKIND=MFCC_0_D_ATARGETRATE=100000.0SAVECOMPRESSED=TUSEHAM原创 2013-12-27 21:41:51 · 6506 阅读 · 7 评论 -
kaldi上使用gpu以及如何安装cuda
转自: 本博客是在@冒顿和群里的一个同学的指导下完成的。特此感谢…… 众所周知,kaldi对硬件的要求,希望大家一开始都弄个好的机器,方便后面自己在kaldi里大展身手。下面是怎么去装cuda和在kaldi中怎么使用。 首先说明我们的显卡是geforce ,其他的显卡是否一样不知道。以下是安装步骤和注意事项: 1、 安装软件: apt-get转载 2014-11-18 10:22:15 · 4041 阅读 · 1 评论 -
语言模型训练工具:SRILM的使用
一、假设原创 2014-04-17 16:16:04 · 5177 阅读 · 0 评论 -
Kaldi运行timit实例记录与结果
将运行Kaldi上timit实例的一些注意事项及结果贴出来win7+ubuntu12.10双系统CPU: i7-2600内存:8G显卡:AMD Radeon HD6450修改:path.sh: KALDI_ROOT=/home/cdj/kaldi-trunk修改:cmd.sh: 使用c部分修改run.sh的MMI+SGMM2阶段的参数: 将--zero-if-dis原创 2014-03-17 19:59:23 · 6059 阅读 · 3 评论 -
HTK孤立词语音识别小系统
我主要参考两篇博客搭建起这个语音识别系统的:http://my.oschina.net/jamesju/blog/116151 http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html感谢两位博主的无私奉献。 我实现的是6个单词的识别,即:hello, world, port, star原创 2013-12-23 14:39:08 · 5885 阅读 · 2 评论 -
Kaldi运行timit语音库的部分结果与问题
使用Kaldi运行了timit的S5实例,只运行到了“tri3 : LDA + MLLT + SAT Training & Decoding”这一步,后面的"SGMM2”,"MMI+SGMM2","DNN + SGMM2"都没有运行成功,原因是在跑SGMM2的时候可能是由于机器配置不够,导致资源消耗完,就卡住了。原创 2014-01-12 16:27:22 · 3132 阅读 · 1 评论 -
HTK搭建大词汇量连续语音识别系统(一)
使用HTK搭建大词汇量语音识别系统,采用的是timit语音库,由于timit语音库的文本语料全是小写,为了与HTKbook中的例子一致,我用python对所有单词和句子都转换成了大写。一、建立任务语法,建立gram 由于timit语音库自带文件中没有HTK能直接使用的任务语法,故我将timit中的发音文件timitdic.txt使用python转换成了任务语法。Python脚本原创 2013-12-26 21:44:52 · 8824 阅读 · 4 评论 -
KALDI工具箱运行TIMIT语料库库实例教程
转自:http://my.oschina.net/jamesju/blog/190894TIMIT数据库介绍: TIMIT数据库由630个话者组成,每个人讲10句,美式英语的8种主要方言。TIMIT S5实例: 首先,将TIMIT.ISO中的TIMIT复制到主文件夹。 1.进入对应的目录,进行如下操作: zhangju@ubuntu :~$ cd k转载 2014-01-08 20:28:50 · 2910 阅读 · 0 评论 -
语音识别工具箱之kaldi----研究联盟
转自:http://blog.youkuaiyun.com/wbgxx333/article/details/17893641今晚突然有个想法,由于kaldi 的中文资料比较少,而且由于这个工具箱比较新,所以我想借用大家的力量来为以后的人研究铺好一些路。所以现在我打算,也是希望大家可以从kaldi的原理上去理解kaldi的实现过程,也是大家不断学习的过程。就像网上很多htk的资料一样,大家也可以来丰富ka转载 2014-01-06 14:28:03 · 2490 阅读 · 0 评论 -
使用Python下载Voxforge语音文件
由于做语音识别需要在使用voxforge的语音文件,但是voxforge文件太多,手工下载肯定不行,可以使用批量下载软件进行下载。而出于好奇,我打算用python自己写一个批量下载脚本,最后虽然能用,但速度不行,而且是单线程的,只能一个文件一个文件的下,就当当作练练手,过一阵再研究多线程的下载。步骤如下:voxforge的English speech files连接为:http://www原创 2014-01-05 14:29:31 · 2261 阅读 · 0 评论 -
Linux下安装测试HTK
1. 安装g++和libx11命令:sudo apt-get install g++ gccsudo apt-get install libx11-dev2. 解压HTK-3.4.1.tar.gz并安装命令:sudo tar xzf HTK-3.4.1.tar.gzcd htksudo ./configure --prefix=/usr/local/su原创 2013-12-24 10:28:23 · 2304 阅读 · 0 评论 -
HTK搭建大词汇量连续语音识别系统(四)
语言学模型训练(1)数据准备使用HTK自带脚本LCond.pl生成分词后的文本语料命令:perl scripts/LCond.pl sentence>trainlanguage其中sentence是之前的trainprompts去掉路径的句子,生成的language如下: SHE HAD YOUR DARK SUIT IN GREASY WASH WATER ALL YEAR原创 2013-12-29 20:42:57 · 3515 阅读 · 3 评论 -
HTK搭建大词汇量连续语音识别系统( 五)
混合高斯模型+语言模型今天事情比较多,就花了点时间看了一下HTKbook的高斯混合模型和data driven,然后使用HVite进行解码,时间比较长,出去吃了个饭,打几局台球回来刚好运行完。1、初始proto 的hmm模型:~o 39 ~h "proto1" 39 5 2 5 1 0.2 39 0.0 0.0 0.0 0.0原创 2013-12-31 21:49:41 · 2781 阅读 · 1 评论 -
HTK搭建大词汇量连续语音识别系统(三)
十、绑定三音素脚本mktri.led:WB spWB silTC执行命令:HLEd -n labels/triphones1 -i labels/wintry.mlf scripts/mktri.led labels/aligned.mlf脚本mktri.hed由脚本命令生成:perl scripts/maketrihed data/monophones1 la原创 2013-12-28 20:57:29 · 4463 阅读 · 8 评论 -
基于kaldi的在线中文识别,online的操作介绍
最近研究了下kaldi,也看了好多文章,感觉这方面的有用文章太少! 大多停留在编译和深层理论方面。对于我们这种没有基础的人,除了看完编译,就只能很茫然的看哪些高高在上的理论了。本文章,适合那些。刚刚编辑完kaldi。想试试手,找找感觉的人来看的。如果你还没有编辑过,可以查查相关文章。有好多。声明一下,本文章,只适合在windows下装虚拟机UBuntu的机器上玩。你的虚拟机内存要大转载 2017-05-05 13:41:48 · 11359 阅读 · 9 评论