
音频处理
雪岢奇
在职员工
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
语音 识别 MFCC DTW 初谈
其实MFCC加DTW模型主要应用于孤立词识别,而且DTW基本用的是DP算法,所以计算量会偏大,对于8KHz的采样率,帧长256,帧叠128,,单通道(双通道帧太多,难以处理)。所能识别的孤立词最多为7个左右,而本人测试了 对于5个词,仅差别一个字,同样是可以识别出的。总的来说该套模型,对于孤立词识别还是有很好的优势,模板训练量要求并不大。不像HMM,需要大批的训练。OK,先介绍下理论的知识。原创 2011-12-06 22:25:24 · 10593 阅读 · 11 评论 -
声音、音频采样率、采样精度等常识概念
什么是声音?能量波,有频率有振幅,频率高低就是音调,振幅大小就是音量;采样率是对频率采样,采样精度是对幅度采样人耳能听到的频率范围是200-20KHz,什么是CODEC?音频压缩CO+解压缩DEC,CODEC就是多媒体数字信号编解码器,主要负责DAC和ADC。不管是音频加速器好,还是I/O控制器好,他们输入翻译 2011-12-06 21:53:34 · 3747 阅读 · 0 评论 -
LibSvm 使用说明 学习心得
View this tutorial in: English Only TraditionalChinese Only Both (Default)(req. JavaScript if you want to switch languages)Core StyleSheets: Chocolate Midnight Modernist Oldstyle Steely Swiss Trad转载 2011-12-20 17:16:59 · 2841 阅读 · 0 评论 -
wave 读写
1. 音频简介 经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录,原创 2011-12-13 19:24:33 · 3693 阅读 · 0 评论