
语音增强
文章平均质量分 95
收集并整理各种语音增强算法的实现方法
Shell-We
记录成长点滴,心怀敬畏,向大神致敬。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
语音增强-频谱映射
语音增强的主要目标是从含噪语音信号中提取纯净语音信号,在自动语音识别、助听器中有着 广泛的应用。经典单通道语音增强方法有,谱减法、维纳滤波法、MMSE估计方法和子空间法,而经典单通道语音增强方法往往假设噪声平稳或变化缓慢,当时处于非平稳噪声条件下时,经典方法性能将会急剧下降。深度语音增强方法可分为两大类:1) 基于映射的语音增强方法; 2) 基于掩模的语音增强方;3)基于信号近似的语音增强方法;原创 2022-05-24 10:09:37 · 1579 阅读 · 0 评论 -
pytorch框架自动调整学习率的几种方式
目录一、引言一、引言 学习率的对于炼丹师来说非常重要,本文主要总结几种pytorch中常用的几种调整学习率的几种方式。学习率要在损失和收敛速度中做出权衡。学习率对于深度学习炼丹来说尤为重要,一个合适的学习率不仅能加速训练的拟合,还能更好地逼近最优解。固定的学习率随着深度学习模型逐渐上升的复杂性已不太适用,动态调整学习率或者对模型不同部分设置不同的学习率已成为一种炼丹趋势1。参考一所有Optimizer公有的一些基本属性:lr: learning rate,学习率eps: 学习率最小值,在原创 2022-04-24 22:26:36 · 7117 阅读 · 0 评论 -
语音信号处理基础知识-常用特征及预处理
摘要 语音信号具有短时平稳性,主要分为清音(声带不振动,高频为主)和浊音(声带振动,低频为主)。常用特征参数包括短时过零率(区分清浊音)、短时平均幅度(反映能量)、基音频率(反映声带振动特性)和梅尔倒谱系数(模拟人耳听觉特性)。预处理包括预加重(提升高频分量)和分帧加窗(10-30ms短时分析)。这些特征和预处理方法在语音识别、说话人识别等领域有重要应用。原创 2021-10-04 13:02:54 · 14010 阅读 · 1 评论 -
经典语音降噪方法-谱减法
谱减法是经典的语音降噪算法,适用于平稳加性噪声环境。其基本思想是利用含噪信号前几帧估计噪声谱,再从混合信号中减去噪声谱。简单谱减法存在过估计导致音乐噪声的问题,改进的过减法引入过减因子α和补偿因子β来优化处理。算法实现包括分帧、噪声估计、谱减处理和重构等步骤。实验结果显示,谱减法能有效降噪,但过减法能进一步减少音乐噪声。该算法计算高效,广泛应用于语音增强领域。原创 2021-09-24 21:57:02 · 12249 阅读 · 2 评论