
语音处理
小白也不想白
这个作者很懒,什么都没留下…
展开
-
机器学习算法汇总:人工神经网络、深度学习及其它
学习方式根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。监督式学习:在监督式学习下,输入数据被称为“训练数据”,每组训练数据转载 2015-10-23 19:13:38 · 756 阅读 · 0 评论 -
语音信号处理
做了2年半的语音信号处理方面的研究了,主要从事算法方面的研究,从一开始的采用S变换提取语音特征进行说话人识别,到后来的语音增强算法研究,HTK学习,然后又回到语音特征提取分析,感觉学习语音信号处理应该有个循序渐进的过程,总结一下,也希望能有这方面的专业人士批评指正。 语音信号处理知识准备阶段:基础: 信号处理 数字信号处理 随机信号处理 数理统计 语音信号处理方面必看书籍转载 2015-10-10 16:53:19 · 1968 阅读 · 1 评论 -
说话人识别
使用 sndpeek 识别说话者让计算机帮助您识别电话会议、podcast 和新闻直播中的说话者 级别: 中级Nathan Harrington (harrington.nathan@gmail.com), 程序员, IBM 2008 年 5 月 29 日使用 sndpeek 和自定义算法在预先录制的库中转载 2015-09-29 20:08:15 · 2815 阅读 · 0 评论 -
timit运行示例一
TIMIT数据库介绍: TIMIT数据库由630个话者组成,每个人讲10句,美式英语的8种主要方言。TIMIT S5实例: 首先,将TIMIT.ISO中的TIMIT复制到主文件夹。1.进入对应的目录,进行如下操作:zhangju@ubuntu :~$ cd kaldi-trunk/egs/timit/s5/zhangju@ubun转载 2015-11-09 18:52:52 · 1954 阅读 · 0 评论 -
ubuntu14.04+cuda6.5+kaldi环境搭建
因为个人水平问题,这个环境搭建用了好长时间。最后虽然能用了,但是Ubuntu的图形界面进不去了,这里分享一下我安装的经验,欢迎大家批评指正。(如果有人有解决办法,欢迎指教,谢谢)先说一下我装的整体思路:一、更新显卡驱动,(因为Ubutnu下的驱动并非是英伟达官方的驱动,要更新为英伟达官方的驱动)二、安装cuda6.5。三、安装kaldi。一、更新显卡驱动1、首先转载 2015-11-09 19:38:41 · 1602 阅读 · 0 评论 -
MFCC(Mel 倒谱系数)
Mel倒谱系数Mel倒谱系数:MFCC Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的缩写是MFCC,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。 用录音设备录制一段模拟语音信号后,经由自定的取样频率(如8000转载 2015-10-09 15:20:01 · 3774 阅读 · 0 评论 -
隐马尔可夫模型详解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。 考虑下面交通灯的转载 2015-11-01 15:54:32 · 1236 阅读 · 0 评论