语音识别
djyangmaowei
学生 在爬行
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
17字的汉语语音识别
测试了一下汉语语音识别 用了十七个汉字 两人录音 各录制五遍 隐马模型有15个状态 效果很理想 90%+的识别率 问题: wav的格式很多 用录音机取得的格式是 系统自带录音机 PCM 22.050 kHz, 16 位, 单声道我们录制是 10KHz, 16-bit PCM 这两个会有冲突 在HCOPY的时候与识别的时候 下一步 366字汉语 录制大型语料库 待此步完成后再写详细总原创 2009-11-16 11:02:00 · 1182 阅读 · 0 评论 -
SAPI 语音识别 Grammar的设置
应用程序可以利用SpSharedRecoContext接口创建不同的与语音识别引擎的连接。每一个连接都可以使用各自的事件并且使用不同的语音识别语法(grammars)。每一个基于SAPI语音识别的应用程序必须具有至少一个SpSharedRecoContext接口。 第一种方法: 自己定义Grammar using System;using System.Collections;原创 2010-03-16 12:27:00 · 9454 阅读 · 63 评论 -
大量的新闻语料库
http://media.cnr.cn/option,com_content,task,category,sectionid,11,id,555,Itemid,349.html我找了好久新闻类的语料 总算在这里找到了 不过还要转化一下频率 还有就是下载自后自己剪切 标记 剩下的工作量还是非常大 之前标记了60个标准普通话考试音频 新闻类的还差很多 就指着这网上资源了 哈哈原创 2010-04-07 15:24:00 · 3228 阅读 · 1 评论 -
汉语连续语音识别基元
汉语连续语音识别基元: 词(Word) 音节(Syllable) 音素(Phone) 声韵母(Initial/Final) 音节就是汉语的发音音节 通过一本字典按照顺序一个个就可查找出来音素是根据语音的自然属性划分出来的最小语音单位。从声学性质来看,音素是从音质角度划分出来的最小语音单位,音素可以分为元音和辅音两大类。气流在口腔或咽头受阻碍而形成的音叫辅音,如 b 、 p、 m原创 2010-04-21 14:23:00 · 1692 阅读 · 0 评论 -
识别基元的选择
语音识别基元的选择在语音识别尤其是连续语音识别中是重要的环节。识别基元的选择应该基于如下两个原则: (1) 具有灵活的可组合性能, 即它能够代表语音中的比较独立的一些个性,可以组成其他的语音单位; (2)具有稳定性,即它应该使得语音中的共性能够得到相当的体现,从而保证识别基元对不同环境的适应能力(即鲁棒性) 。原创 2010-04-27 10:07:00 · 1172 阅读 · 0 评论 -
交换 中文普通话语料
本人手上有大概3G的中文普通话语料 标记方法如下:Sentence 050001:作品五号。Sentence spell:zuo4 pin3 wu3 hao4Sentence 050002:这是入冬以来,Sentence spell:zhe4 shi4 ru4 dong1 yi3 lai2Sentence 050003:胶东半岛上Sentence spell:jiao1 dong1 ban4 da原创 2010-05-12 13:20:00 · 8609 阅读 · 1 评论 -
应用HTK搭建连续语音识别系统(总结)
一 基于HMM的连续语音识别与HTK工具包介绍语音识别系统的分类被识别人:特定人 非特定人词汇量:小词汇量 中词汇量 大词汇量说话方式:孤立词 连接词 连续词语言:汉语 英语 法语… 我们做的非特定人大词汇量连续汉语语音识别系统也叫 汉语语音听写机 隐马尔可夫模型(Hidden Markov Mode原创 2010-05-21 17:00:00 · 9122 阅读 · 8 评论 -
HTK 语音识别 ASK
<br /><br />大词汇量连续语音识别用声韵母建模 <br />在新增加一个读音时 可以只修改dict与gram即可<br /> <br />HTK中识别结果到时间转换<br />13600000 16320000 hao-1452.207031<br />直接除以10的7次方<br />hao的发音从1.36秒到1.632秒 也就是说HTK是以100微秒作为基本单位输出<br /> <br /> <br />HTK bad data or over pruning 报警<br /> <br />原创 2010-05-31 16:18:00 · 12916 阅读 · 1 评论
分享