
语音识别与TTS
文章平均质量分 89
zouxy09
关注机器学习计算机视觉人机交互和人工智能领域。
展开
-
语音信号处理之(一)动态时间规整(DTW)
语音信号处理之(一)动态时间规整(DTW)zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第一个知识点:DTW。因为花的时间不多,所以可能会有不少说的不妥的地方,还原创 2013-06-20 20:11:20 · 105038 阅读 · 28 评论 -
TTS技术简单介绍和Ekho(余音)TTS的安装与编程
TTS技术简单介绍和Ekho(余音)TTS的安装与编程zouxy09@qq.com一、TTS技术简单介绍: TTS技术,TTS是Text To Speech的缩写,即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他语言语音)输出的技术,隶属于语音合成(SpeechSynthesis)。TTS的基本组成:(1)原创 2012-08-26 15:27:59 · 30801 阅读 · 9 评论 -
交互系统的构建之(三)TTS语音合成的加盟
交互系统的构建之(三)TTS语音合成的加盟zouxy09@qq.com 人机交互系统的构建之(一)http://blog.youkuaiyun.com/zouxy09/article/details/7919618中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检测等等。原创 2012-08-29 16:48:15 · 9762 阅读 · 6 评论 -
语音的基本概念--译自CMU sphinx
语音的基本概念--译自CMU sphinxzouxy09@qq.com 译自:http://cmusphinx.sourceforge.net/wiki/tutorialconcepts 这是CMU sphinx语音识别系统wiki的第一部分,主要是介绍语音的一些基本概念的。我试着翻译了一下。英语水平受限,翻译难免出错,请各位不吝指点!呵呵 Basi翻译 2012-09-04 10:53:23 · 28397 阅读 · 8 评论 -
语音识别的基础知识与CMUsphinx介绍
语音识别的基础知识与CMUsphinx介绍zouxy09@qq.com 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。 基于语音识别芯片的嵌入式产品也越来越多,如Sensory公司的RSC系列语音识别芯片、Infineon公司的Unispeech和Unilite语音芯片等,这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上,目原创 2012-09-04 13:06:06 · 55780 阅读 · 28 评论 -
PocketSphinx语音识别系统的编译、安装和使用
PocketSphinx语音识别系统的编译、安装和使用zouxy09@qq.com Sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。Sphinx从开发之初就得到了CMU、DARPA等多个部门的资助和支持,后来逐步发展为开源项目。目前CMU Sphinx小组开发的下列译码器: Sphinx-2采用半连续隐含马尔可夫模型(SC原创 2012-09-04 16:36:29 · 68715 阅读 · 37 评论 -
PocketSphinx语音识别系统语言模型的训练和声学模型的改进
PocketSphinx语音识别系统语言模型的训练和声学模型的改进zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外两篇博文:语音识别的基础知识与CMUsphinx介绍:http://blog.youkuaiyun.com/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和原创 2012-09-06 09:27:01 · 35114 阅读 · 16 评论 -
PocketSphinx语音识别系统声学模型的训练与使用
PocketSphinx语音识别系统声学模型的训练与使用zouxy09@qq.com 声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数(通过不断地学习和改进得到最优的,也就是概率最大的一组HMM模型参数)。需要训练的情况:1)需要创建一个新的语音或者方言的模型;2)为你的小词汇的应用创建一个特定的模型;3)你有足原创 2012-09-10 10:37:54 · 26797 阅读 · 18 评论 -
PocketSphinx语音识别系统的编程
PocketSphinx语音识别系统的编程zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外的博文:语音识别的基础知识与CMUsphinx介绍:http://blog.youkuaiyun.com/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和使用:http:/原创 2012-09-14 10:59:11 · 30902 阅读 · 8 评论 -
语音信号处理之(三)矢量量化(Vector Quantization)
语音信号处理之(三)矢量量化(Vector Quantization)zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第三个知识点:VQ。因为花的时间不多,所以可能会原创 2013-06-23 00:04:30 · 55434 阅读 · 8 评论 -
语音信号处理之(四)梅尔频率倒谱系数(MFCC)
语音信号处理之(四)梅尔频率倒谱系数(MFCC)zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第四个知识点:MFCC。因为花的时间不多,所以可能会有不少说的不妥的地原创 2013-06-23 21:05:57 · 227892 阅读 · 62 评论 -
语音信号处理之(二)基音周期估计(Pitch Detection)
语音信号处理之(二)基音周期估计(Pitch Detection)zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第二个知识点:基音周期估计。我们用C++实现了基于自原创 2013-06-21 00:43:21 · 77012 阅读 · 70 评论 -
zouxy09博客原创性博文导航
zouxy09博客原创性博文导航zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 一、基于计算机视觉的目标跟踪计算机视觉、机器学习相关领域论文和源代码大集合计算机视觉目标检测的框架与过程最简单的目标跟踪(模版匹配)压缩感知(Compressive Sensing)学习之(一)压缩感知(Compressive Sensing)学习之(二)压缩跟踪Compressi原创 2013-11-06 09:44:16 · 113697 阅读 · 48 评论