声音特征提取-STFT短时傅里叶变换

短时傅里叶变换

  • STFT原理

    **FT:**从长时的完整信号得到的频谱是对应于整个时间轴的,即通过傅里叶变换,我们可以清晰地得出完整的原始信号包含的所有频率分量,但是它无法描述局部区域上的频率特征,缺少时间信息。

    **STFT:**是分析非平稳信号的常用技术,水下目标声音信号大多为非平稳信号,即特性随时间变化的信号,所以常用STFT处理。STFT原理:将长时非平稳信号加窗进行短时分割,在短时内信号可以视作平稳信号,可以进行FT变换,通过窗函数的滑动得到每一个窗口内信号的傅里叶变换结果,这些结果堆叠起来排开,得到的就是一个二维的时频域特征图,表征了整个信号在时间和频率上的分布。
    在这里插入图片描述

分帧的窗口长度决定了变换后时频图的时间分辨率和频率分辨率,窗长越长,截取到的信号越长,变换后频率分辨率越高,但是时间分量之间的距离则变大了,信号的短时变化特征无法很好的反应出来;反之,窗长越短,截取到的信号越短,频率分辨率越差,频域分量之间的距离变大,相邻频率分量之间的泄露会更加明显,而时间分辨率越好。即STFT中,时间分辨率和频率分辨率不能兼得。

  • STFT的时域和频域

    STFT的时域公式如下:

    在这里插入图片描述

    窗口函数w(k)起到了平滑信号的作用,对每个时间段窗口内信号进行FT变换,则可以得到信号在整个时间和频率上的分布。时域公式描述了信号在不同时间段内振幅的变化情况。

    STFT的频域公式如下:

在这里插入图片描述
在每个时间位置K上,对整个信号使用窗W(n-k)加权,得到长为N的序列,对序列进行FT,得到信号在频率上的分量。重复此过程,在每个位置K和频率点m,都可以得到对应的FT系数X(m,k)。频域公式表述了信号在不同频率上的成分,通过连接每个窗口随时间变化的幅度谱,则获得了信号的时频表示。

  • 窗函数

    窗函数法基本原理

    常用窗包括矩形窗、汉明窗、汉宁窗

    • 矩形窗:

      在这里插入图片描述

      作用是将信号在窗口内截断,对窗口外的信号进行衰减。由于在时域乘以了窗函数,频域则是做卷积,频谱中除了主瓣以外,还有旁瓣,即频谱泄露。未加权的矩形窗泄露最为严重。

      深入浅出的理解频谱泄露

    • 汉明窗:汉明窗是一种平滑的窗口函数,在窗口内外转换相对平滑,可以减少频谱泄露

      在这里插入图片描述

    • 汉宁窗:也是一种平滑的窗口函数

      在这里插入图片描述

n表示窗口内采样点索引,范围为【0,L-1】

参考资料:

基于机器学习的水声目标识别技术研究-刘璐

基于联合神经网络的水声目标识别技术研究-任晨曦

甚干去噪的水声信号神经 网络识别 技术研究-王旭阳

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

等待整个冬天

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值