- 博客(11)
- 资源 (1)
- 收藏
- 关注
原创 声音特征提取--Demon谱分析(舰船水声)
不同频带的DEMON谱线相互之间也不一样,有的频带内会发生线谱遗失,有的频带内的线谱并不是真正的谱线。当舰船航速达到某个极限时,螺旋桨的高速旋转将产生空化噪声,由螺旋桨产生的一系列周期信号被空化噪声调制,在频域上表现为将低频的离散线谱线性搬移到较高频率噪声所处的频率周围,这些周期信号在频域是离散的线谱系列,对应舰船的轴频、叶频以及谐波频率,由于舰船辐射噪声低频部分还有其它噪声源,很难从低频段直接提取出螺旋桨产生的线谱系列,而是要先对高频段的调制信号进行解调,通过低通滤波得到信号的低频包络谱,即。
2024-01-02 17:45:25
4186
1
原创 舰船辐射噪声机理分析
当螺旋桨叶片形状不规范,或桨叶边缘粗糙时,叶片附近会出现卡门涡线性,将叶片看作一个弹性体,自由度是N,螺旋桨叶片存在多个固有频率,当卡门涡与螺旋桨分离时的频率与螺旋桨叶片某个固有频率一样时,会发生一起振动的现象,即**“唱音**”。为线谱、连续谱和调制谱的混合,可以将噪声大致分为3类,分别为机械设备振动发出的噪声(机械噪声)、螺旋桨旋转推进驱动发出的噪声(螺旋桨噪声)、以及周围流体对舰船作用发出的噪声(水动力噪声),螺旋桨叶片的m次谐波频率,m为相应的谐波次数,n为桨叶的数量,s为螺旋桨转速。
2023-12-29 17:34:25
1581
1
原创 声音特征提取--Mel梅尔频谱、梅尔倒谱系数MFCC
主要频率成分包含了声音的识别属性,在声目标识别时,我们需要找到共振峰的位置还有它们转变的过程,所以我们提取的是频谱的包络:一条连接共振峰点的平滑曲线。但是人耳感知到的声音高低与声音的原始频率并不呈线性关系,人耳对低频声音更加敏感,低频区域的差异变化比较容易被感受,而对于高频声音的变化感知并不明显。比如10hz和110hz的声音,人耳能够明显感觉到不同,而1000hz和1100hz的声音,人耳感觉会是一样的。这样使得在Mel刻度上相等距离的两对频度,人耳的感知差异也是相同的,即人耳感知和梅尔尺度呈线性关系。
2023-12-26 16:21:14
2025
1
原创 声音特征提取-STFT短时傅里叶变换
分帧的窗口长度决定了变换后时频图的时间分辨率和频率分辨率,窗长越长,截取到的信号越长,变换后频率分辨率越高,但是时间分量之间的距离则变大了,信号的短时变化特征无法很好的反应出来;频域公式表述了信号在不同频率上的成分,通过连接每个窗口随时间变化的幅度谱,则获得了信号的时频表示。:将长时非平稳信号加窗进行短时分割,在短时内信号可以视作平稳信号,可以进行FT变换,通过窗函数的滑动得到每一个窗口内信号的傅里叶变换结果,这些结果堆叠起来排开,得到的就是一个二维的时频域特征图,表征了整个信号在时间和频率上的分布。
2023-12-24 16:39:23
995
原创 小波阈值去噪--最详细易懂
因此,经小波分解后,信号的小波系数幅值要大于噪声的系数幅值,可以认为,幅值比较大的小波系数一般以信号为主,而幅值比较小的系数在很大程度上是噪声。信号经过小波变换得到的小波系数含有重要的时频信息,真实信号的小波系数较大,噪声的小波系数较小,选取一个合适的阈值,保留系数较大的,将小的置0,就可保留信号滤除噪声。软阈值通常设置一个阈值λ,当小波系数向0收敛过程中,大于λ的系数,置为sgn(W)(|W|-λ),对于小于λ的小波系数,直接置0,可以获得更加平滑的去噪信号。对处理后的信号重构,得到去噪声后的信号。
2023-12-01 21:55:19
10443
3
原创 Attention注意力机制综述(二)--多头自注意力机制(含代码)Multi-head Self-Attention Machanism
dim_in:输入中每个token的维度,也就是输入x的最后一个维度#d_model:single-head-attention情况下q、k、v总的向量长度#num_heads:head个数self.head_dim=input_dim//num_heads#head的维度为输入维度除以head个数,方便后面拼接#输入数据shape=[batch_size,token个数,token长度]#将输出向量经过矩阵乘法后拆分为多头。
2023-11-28 22:02:09
3716
3
原创 Attension注意力机制综述(一)——自注意力机制self_attention(含代码)
在注意力机制的背景下,将自主性提示称为查询(query)。给定任何查询,注意力机制通过注意力池化(attention pooling) 将选择引导至感官输入(sensory inputs,例如中间特征表示)。在注意力机制中,这些感官输入被称为值(value),更通俗的解释每个值都与一个键(key)配对, 即感官输入的每个非自主提示都与一个值(value)匹配,注意力机制通过查询选择出我们需要的key-value。
2023-11-27 17:36:08
2140
1
原创 基于深度学习的语音信号处理基础
【1】维涅斯的大火花. [天子学习]深度学习中的语音信号处理基础&代码实现[EB/OL]. [2023.10.30]. https://www.bilibili.com/video/BV1f3411C7kb/?基频说明了声带发出的声音的(基音)振动的频率变化,而共振峰说明了声带发出的基音与声道谐振的声音的频率的变化。n_fft/2+1:每帧可以提取到176组不同的幅度相位,win_length/采样率:每两个频率间隔。则整张图可表示语音信号的各个频率分量随着时间变化,其幅度的强弱的变化。
2023-10-30 18:09:33
520
4
原创 语音信号特征提取详解-MFCC、FBank、Mel谱
如何训练一个声纹识别模型:从原理到实践”,第二章:训练数据的格式与加载方法[EB/OL]. [2023.10.30]. https://www.bilibili.com/video/BV19q4y137i4/?语音分帧后,需要在时域乘以窗函数以增加帧左端和右端的连续性,减少频谱泄露,使窗口两端不会急剧变化而平滑过渡到0,从而使截出的语音波形帧缓慢降为0,减小语音帧的截断效应。在梅尔滤波器构建完成后,要得到梅尔倒谱能量,还需要对傅里叶变换后的频率谱执行 Mel 滤波运算,以计算每阶滤波器的能量和总能量值。
2023-10-30 11:38:29
1775
1
原创 pwm,输入捕获,定时器中断混合操作led(基于stm32f4探索者)
所需要实现的功能通过按键捕获,长按来切换三种模式(为了写程序的方便,直接朴取正点原子给出的输入捕获例程)模式2:通过短按来切换led1的相位,实现视觉上的延迟模式3:led0闪烁作为计时器,通过短按切换led1的状态模式1 默认状态为pwm占空比每次增大0.2,长按key0 pwm占空比每次减小0.2 //pwm模式中将会用到的变量 u16 terminal=300;//计数器的最大值 u16 led0pwmval=0;//递增模式下计数器的初始值 u16 key0pwmval=300;/
2021-07-31 23:25:59
805
数电实验——汽车尾灯,小脚丫fpga
2022-02-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人