python mel

  1. 直接调用librosa做mel谱的变换
signal = soundfile.read(wav_dir, fs)
melspec = librosa.feature.melspectrogram(signal, sr=22050,
                                    n_fft=2048, 
                                    hop_length=512, #是skip的长度,不是重叠的长度
                                    n_mels = 64)   # mel得到的fbank的长度
logspec = librosa.logamplitude(melspec)#计算log mel 

得到的melspec的维度是(n_mel, wav_length)
做一个矩阵转制 melspec.T
fbank经过DCT变换得到的是mfcc

ref: 有比较完整的前端处理方法https://github.com/ZhihaoDU/speech_feature_extractor/blob/master/feature_extractor.py

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值