
AuidoProcess
文章平均质量分 79
凌风探梅
这个作者很懒,什么都没留下…
展开
-
更新词汇至Unigram词表进行识别
from:http://blog.youkuaiyun.com/lifesider/article/details/6553096完成CMU Sphinx Toolkit到UNICODE的移植后,由于其自身支持的中文词汇太少且过于简单,实际生活中的很多词汇无法识别,由于其缺少开发文档,只能在代码跟踪的过程里心烦了。 于是想,肯定需要在词典文件中增加新词汇吧,如果其本身是按照Ciphon转载 2016-04-15 09:03:59 · 1259 阅读 · 0 评论 -
基于内容的音频检索
李国辉·返回---- 对于人的感官来说,有视觉、听觉、触觉和味觉等方面的感知。在视觉方面,可以感知位置、运动、颜色、纹理、形状、符号等;在听觉方面,可以感知位置、运动、音调、音量、旋律等;另外还有触觉(机械的、热的、电的、肌肉运动方面的)和嗅觉(气味、味道等)。除了视觉、触觉和嗅觉外,人们可以从听觉中获得许多信息,如我们日常收听的电台节目、欣赏的音乐、聆听的自然声响等。有许多与音频相关转载 2016-04-18 09:56:48 · 7276 阅读 · 0 评论 -
语音识别系统及科大讯飞最新实践
http://geek.youkuaiyun.com/news/detail/96948语音作为最自然便捷的交流方式,一直是人机通信和交互最重要的研究领域之一。自动语音识别(Automatic Speech Recognition,ASR)是实现人机交互尤为关键的技术,其所要解决的问题是让计算机能够“听懂”人类的语音,将语音中传化为文本。自动语音识别技术经过几十年的发展已经取得了显著的成效。近年来转载 2016-08-25 08:42:12 · 2952 阅读 · 0 评论 -
Around the World in 60 Days: Getting Deep Speech to Work in Mandarin
Around the World in 60 Days: Getting Deep Speech to Work in MandarinFebruary 2016Ryan J. PrengerBaiduryanprenger@baidu.comTony HanBaidutonyhan@baidu.com转载 2016-09-21 09:35:48 · 817 阅读 · 0 评论