
语音处理
小卓12138
交流ALIZE SPRO HTK CNTK等的工具的使用及GMM_UBM SVM JFA i-vector/PLDA SOLA PSOLA phase vecoder 等算法的交流可以加QQ讨论群:488684256
展开
-
音频重采样的实现
在声纹识别中,为了满足对不同采样率的要求,常需要对语音进行重采样。重采样即将原始的采样频率变换为新的采样频率以适应不同采样率的要求。实现重采样的传统方法有三种:一是若原模拟信号x(t)可以再生,或是已记录下来,那么可以进行重新采样;二是将x(n)通过数模转换D/A变成模拟信号x(t),对x(t)经模数转换A/D在重新采样;三是L/M倍采样率转换算法,对采样后的数字信号x(n),在“数字域”做采样率原创 2015-08-07 14:09:43 · 8142 阅读 · 0 评论 -
基于减少计算量的MFCC提取
在特征提取过程的模块,如预加重,加窗,框架,FFT,过滤器,对数能量,余弦变换中都含有大量的乘法运算,其中,在FFT耗费了大量的计算量。太多的乘法导致系统的能力要求高,能源消耗大,稳定性较低,应用范围窄。所以希望在不改变结果的条件下,对MFCC提取过程进行优化。翻译 2015-09-18 10:25:56 · 848 阅读 · 0 评论 -
互相关法提取基音
总结了一篇文章中关于使用互相关法提取基音的方法翻译 2015-09-18 10:59:37 · 994 阅读 · 0 评论 -
语音特征高斯化方法
本博文参考文章开头提供的文献,对feature warping方法做了总结归纳原创 2015-09-18 12:06:36 · 853 阅读 · 0 评论 -
基于IMCRA算法的语音增强方法
一种基于统计的噪声估计方法,可以用于语音增强。采用IMCRA算法,对各个频带噪声进行估计,然后进行噪声消除实现语音增强。原创 2015-10-12 13:57:14 · 5014 阅读 · 0 评论 -
BTK工具使用
1.要先安装以下工具· Python - scripting language interpreter· Numpy - Matlab like extension to python· GSL - GNU Scientific Library· SWIG - simplified wrapper an原创 2017-02-14 15:55:26 · 2661 阅读 · 4 评论 -
audition CS6.0 无法打开.aac 文件和 .3gpp文件问题解决
Audition作为音频分析软件是一个不错的选择,但最近在分析.aac文件和.3gpp文件时遇到了无法打开的尴尬。下面附上我的解决方案。首先在Adobe Audition 界面旋转编辑 → 首选项 →媒体与暂存盘 然后将 Enable DMLS Format Support 和 Enable DMLS preview in the media Browser(may be slower)两原创 2017-05-24 14:49:00 · 5551 阅读 · 0 评论