自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 高斯混合模型GMM

高斯混合模型假设数据是由多个高斯分布混合生成的,其概率密度函数是多个高斯分布的加权和:

2024-10-09 22:02:01 1161

原创 信号频域分析的谱质心与子带带宽

谱质心是指频谱的“重心”或“中心位置”,它描述了信号的频谱能量集中在哪个频率范围。具体来说,谱质心反映的是频谱的亮度,通常与信号的感知“音色”相关。对于人耳来说,较高的谱质心值通常意味着音频信号听起来较为“明亮”,而较低的谱质心则意味着声音听起来较为“低沉”。数学上,谱质心的计算公式为:

2024-10-09 21:36:56 1541

原创 均方根能量

均方根能量是一种衡量信号功率的指标,它考虑了信号的瞬时幅度,能有效描述信号在一定时间范围内的强弱程度。其计算公式如下:

2024-10-09 21:28:23 931

原创 时域分析幅值包络

幅值包络是信号振幅随时间变化的光滑曲线,它用于捕捉信号的宏观强度趋势。具体来说,幅值包络可以被视为信号振幅的包络线,即将信号的峰值连接起来,形成一个较为平滑的曲线。它通常用于分析信号的能量变化,而忽略微小的振荡和高频分量。简单来说,幅值包络可以帮助识别信号的强弱变化模式,而不关注信号的具体振荡细节。

2024-10-09 21:17:43 1250

原创 零交叉率(Zero-Crossing Rate, ZCR)

零交叉率的定义为信号的符号(正负号)发生变化的次数,通常表示为单位时间内的变化频率。具体而言,音频信号从正值变为负值,或从负值变为正值时,就发生了一次零交叉。零交叉率可以用以下公式表示:

2024-10-09 21:09:39 1702

原创 梅尔频率倒谱系数

分帧、加窗;对每一帧进行快速傅里叶变换,得到频谱;使用梅尔尺度滤波器组,模拟人耳感知;计算每个滤波器的对数能量,模拟响度感知;通过离散余弦变换提取倒谱系数,去除频谱信号中的冗余信息;得到 MFCC 特征向量,并可进一步计算动态特征。MFCC 是语音和音频分析中的一种广泛使用的特征提取技术,通过模仿人类的听觉系统,将复杂的音频信号转化为易于处理的特征向量。这种方法不仅减小了数据的维度,还保留了信号的重要频谱信息,特别适用于语音识别等任务。

2024-10-09 20:49:43 1442 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除