- 博客(6)
- 收藏
- 关注
原创 信号频域分析的谱质心与子带带宽
谱质心是指频谱的“重心”或“中心位置”,它描述了信号的频谱能量集中在哪个频率范围。具体来说,谱质心反映的是频谱的亮度,通常与信号的感知“音色”相关。对于人耳来说,较高的谱质心值通常意味着音频信号听起来较为“明亮”,而较低的谱质心则意味着声音听起来较为“低沉”。数学上,谱质心的计算公式为:
2024-10-09 21:36:56
1541
原创 时域分析幅值包络
幅值包络是信号振幅随时间变化的光滑曲线,它用于捕捉信号的宏观强度趋势。具体来说,幅值包络可以被视为信号振幅的包络线,即将信号的峰值连接起来,形成一个较为平滑的曲线。它通常用于分析信号的能量变化,而忽略微小的振荡和高频分量。简单来说,幅值包络可以帮助识别信号的强弱变化模式,而不关注信号的具体振荡细节。
2024-10-09 21:17:43
1250
原创 零交叉率(Zero-Crossing Rate, ZCR)
零交叉率的定义为信号的符号(正负号)发生变化的次数,通常表示为单位时间内的变化频率。具体而言,音频信号从正值变为负值,或从负值变为正值时,就发生了一次零交叉。零交叉率可以用以下公式表示:
2024-10-09 21:09:39
1702
原创 梅尔频率倒谱系数
分帧、加窗;对每一帧进行快速傅里叶变换,得到频谱;使用梅尔尺度滤波器组,模拟人耳感知;计算每个滤波器的对数能量,模拟响度感知;通过离散余弦变换提取倒谱系数,去除频谱信号中的冗余信息;得到 MFCC 特征向量,并可进一步计算动态特征。MFCC 是语音和音频分析中的一种广泛使用的特征提取技术,通过模仿人类的听觉系统,将复杂的音频信号转化为易于处理的特征向量。这种方法不仅减小了数据的维度,还保留了信号的重要频谱信息,特别适用于语音识别等任务。
2024-10-09 20:49:43
1442
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人