
音频信号分类
audiocool
专注于音频数字信号处理领域,掌握语音降噪,回声消除,啸叫抑制,均衡器,自动增益,限幅器等音频前级处理算法。熟悉数字麦克风阵列波束处理,数字音频水印等。欢迎志同道合的朋友一起探讨!
展开
-
WSOLA
摘要时域压扩(Time-scale modification简称TSM,又叫变速不变调)是一个能够改变音频的"语速"而不改变其音调的算法,是一个在目前音频信号处理中必不可少的一种重要算法,然而音频信号是多种多样的(包含了各种谐波(基音,泛音)冲击和瞬态分量),因为这种广泛的声学和音频特性,因此,目前没有一种能够通用的TSM算法,你需要依据音频特性来选择合适的TSM方法,本文的目的也就是科普一系...转载 2020-03-26 20:08:10 · 3709 阅读 · 3 评论 -
介绍一种音频信号分类方法
能用来区分语音和音乐信号的音频特征有很多种,如感觉特性、能量、功率谱和Mel频标倒谱(MFCC)系数,能量、平均过零率、基频和功率谱峰值等。以下介绍一种基于子带音调个数比与频谱倾斜度相结合的区分方法。一、基本原理 不同类型的音频,其音调分量在各个子带的分布有所不同。语音的音调分量绝大部分分布在低频处,而音乐的音调分量在各个子带的分布则相对较均匀。利用该特性可区分音乐与语音信号。由原创 2017-12-04 14:32:33 · 8603 阅读 · 1 评论