
语音处理杂谈
我是个粉刷匠
专注于深度学习和机器学习等算法领域,拥有kaggle项目经验,目前主要从事语音处理和图像处理在深度学习技术方面的研究与应用,熟悉Keras、Matlab、TensorFlow、Linux等。邮箱:tanghaitao_ape@163.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
语音信号的同态处理、倒谱分析和Mel频率倒谱系数
1 同态处理 信号的同态处理也称同态滤波。大概步骤为: f(x,y)→ln→DFT→H(u,v)→(DFT)-1→exp→g(x,y) 虽然,一般用于图像处理。但是,博主将同态滤波用于语音信号的滤波。直接上程序吧 clc;clear %% filedir=[]; % 指定文件路径 filename='bluesky3.wav';原创 2017-02-02 18:36:49 · 6881 阅读 · 3 评论 -
语音信号的时域、频域特性和短时分析技术
第一次写CDSN,有点小小的紧张,文笔不是很好,希望大家见谅。这里,我通过最近的学习,总结了语音信号时域分析特性。可能有些不足,希望大家指点。原创 2017-02-01 20:04:11 · 11404 阅读 · 0 评论 -
说话人识别matlab实现
说话人识别 这里,博主对说话人两个baseline模型应该matlab的MSR工具箱进行处理。 1、GMM-UBM说话人识别 这里主要分为4个步骤: 1、训练UBM通用背景模型 2、最大后验准则MAP从UBM通用背景模型里面训练每一个说话人的声学模型 3、交叉得分 4、计算最终的测试效果,这里用AUC和EER表示,可以方便与最近的深度学习方法做比较。 具体程序 设置环境参数:说话原创 2017-12-21 20:42:45 · 9846 阅读 · 10 评论