
Linux
文章平均质量分 88
zouxy09
关注机器学习计算机视觉人机交互和人工智能领域。
展开
-
openal全教程
/***************************************************************************openal全教程分类: OpenSceneGraph 2008-12-01 16:22 3015人阅读 评论(1) 收藏 举报 openal教程(一)简介L一直在不断 欢迎来到OPENAL的世界!OPENA的创新,几乎没有转载 2012-08-21 20:55:47 · 20459 阅读 · 5 评论 -
OpenAL跨平台音效API的安装与移植
OpenAL跨平台音效API的安装与移植zouxy09@qq.com OpenAL(Open Audio Library)是自由软件界的跨平台音效API。它设计给多通道三维位置音效的特效表现。其 API 风格模仿自 OpenGL。 OpenAL 最初是由 Loki Software 所开发。是为了将 Windows 商业游戏移植到 Linux 上。Loki 倒原创 2012-08-21 20:51:36 · 18573 阅读 · 3 评论 -
Yaffs2根文件系统制作
Yaffs2根文件系统制作 zouxy09@qq.com环境: 交叉编译环境:4.3.3 (天嵌科技提供,存放路径/home/xiaoyi/4.3.3)开发平台:TQ2440注:这里有一些东西没有提到,请结合天嵌提供的linux移植手册来进行移植 一、编译busybox(主要是获得linux下的工具包和函数库,如bin、sbin下的工具)获取busybox原创 2012-08-24 19:00:36 · 11332 阅读 · 0 评论 -
TTS技术简单介绍和Ekho(余音)TTS的安装与编程
TTS技术简单介绍和Ekho(余音)TTS的安装与编程zouxy09@qq.com一、TTS技术简单介绍: TTS技术,TTS是Text To Speech的缩写,即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他语言语音)输出的技术,隶属于语音合成(SpeechSynthesis)。TTS的基本组成:(1)原创 2012-08-26 15:27:59 · 30801 阅读 · 9 评论 -
交互系统的构建之(一)重写Makefile编译TLD系统
交互系统的构建之(一)重写Makefile编译TLD系统zouxy09@qq.com 为了对TLD系统做一些功能的填充,例如添加语音合成来提示跟踪状态,或者加入语音识别来增加交互体验等,我就自己写了个Makefile来编译TLD系统。因为TLD的Makefile是通过cmake生成的,比较复杂,如果要加入语音合成等等API的库或者头文件的话,我都不知道在什么地方加,所以自己的整理原创 2012-08-29 12:34:10 · 7123 阅读 · 3 评论 -
交互系统的构建之(二)Linux下鼠标和键盘的模拟控制
交互系统的构建之(二)Linux下鼠标和键盘的模拟控制zouxy09@qq.com 交互系统的构建之(一)http://blog.youkuaiyun.com/zouxy09/article/details/7919618 中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检原创 2012-08-29 14:53:03 · 16900 阅读 · 2 评论 -
交互系统的构建之(三)TTS语音合成的加盟
交互系统的构建之(三)TTS语音合成的加盟zouxy09@qq.com 人机交互系统的构建之(一)http://blog.youkuaiyun.com/zouxy09/article/details/7919618中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检测等等。原创 2012-08-29 16:48:15 · 9762 阅读 · 6 评论 -
语音的基本概念--译自CMU sphinx
语音的基本概念--译自CMU sphinxzouxy09@qq.com 译自:http://cmusphinx.sourceforge.net/wiki/tutorialconcepts 这是CMU sphinx语音识别系统wiki的第一部分,主要是介绍语音的一些基本概念的。我试着翻译了一下。英语水平受限,翻译难免出错,请各位不吝指点!呵呵 Basi翻译 2012-09-04 10:53:23 · 28397 阅读 · 8 评论 -
语音识别的基础知识与CMUsphinx介绍
语音识别的基础知识与CMUsphinx介绍zouxy09@qq.com 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。 基于语音识别芯片的嵌入式产品也越来越多,如Sensory公司的RSC系列语音识别芯片、Infineon公司的Unispeech和Unilite语音芯片等,这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上,目原创 2012-09-04 13:06:06 · 55780 阅读 · 28 评论 -
PocketSphinx语音识别系统的编译、安装和使用
PocketSphinx语音识别系统的编译、安装和使用zouxy09@qq.com Sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。Sphinx从开发之初就得到了CMU、DARPA等多个部门的资助和支持,后来逐步发展为开源项目。目前CMU Sphinx小组开发的下列译码器: Sphinx-2采用半连续隐含马尔可夫模型(SC原创 2012-09-04 16:36:29 · 68715 阅读 · 37 评论 -
PocketSphinx语音识别系统语言模型的训练和声学模型的改进
PocketSphinx语音识别系统语言模型的训练和声学模型的改进zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外两篇博文:语音识别的基础知识与CMUsphinx介绍:http://blog.youkuaiyun.com/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和原创 2012-09-06 09:27:01 · 35114 阅读 · 16 评论 -
PocketSphinx语音识别系统声学模型的训练与使用
PocketSphinx语音识别系统声学模型的训练与使用zouxy09@qq.com 声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数(通过不断地学习和改进得到最优的,也就是概率最大的一组HMM模型参数)。需要训练的情况:1)需要创建一个新的语音或者方言的模型;2)为你的小词汇的应用创建一个特定的模型;3)你有足原创 2012-09-10 10:37:54 · 26797 阅读 · 18 评论 -
PocketSphinx语音识别系统的编程
PocketSphinx语音识别系统的编程zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外的博文:语音识别的基础知识与CMUsphinx介绍:http://blog.youkuaiyun.com/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和使用:http:/原创 2012-09-14 10:59:11 · 30902 阅读 · 8 评论 -
Android学习笔记之(一)开发环境搭建
Android学习笔记之(一)开发环境搭建zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 至于说Android是什么之类的俺就不啰嗦了,因为它离我们太近了。直接上手配置环境。对于程序开发员来说,面对一个新的东西,上手莫过于几个东西了:开发包(提供了哪些API)、编程语言(用什么语言来编程)和开发环境(包括IDE和Tools),然后原创 2013-03-17 20:50:38 · 24238 阅读 · 1 评论 -
ubuntu 12.04安装与配置
zouxy09@qq.comUbuntu是一个以桌面应用为主的Linux操作系统。Ubuntu每六个月发布一个新版本(一般是4和10月份,命名为YY.MM),每一个普通版本都将被支持 18个月,长期支持版(Long Term Support, LTS)的桌面版本支持 3年,服务器版本则是 5 年。因为她安装软件很方便(对于有网络而言),所以开发运用很方便。1、安装ubuntu原创 2012-08-21 21:00:30 · 26756 阅读 · 0 评论