使用Python进行声音信号处理 学习笔记

这篇博客记录了一位初学者使用Python的librosa库进行MFCC特征提取的经历。作者在处理音频数据时遇到了librosa.load报错的问题,通过检查文件和安装ffmpeg解决了问题。成功提取MFCC特征后,使用np.save保存了数据,并通过np.load验证了保存的效果。

之前没有用python处理数据的经验,从零开始学习。感觉python和c最不同的一点是intent
一般处理声音都是要先提取特征值。
毕竟时域看不出来什么区别,所以采用的是频域的方法。
参考了好多论文,用MFCC作为特征值的方法比较多,于是准备试试。
在python这边主要用的librosa库和python_speech_features包,这里选用的是librosa的方法
开始真是各种错误频出。。。

  1. 分割完声音数据后用librosa.load居然说是imcomplete wav chunk
    然后百度了一下,首先先试试能不能用播放器打开这些wav文件,然后发现能打开了后,看来要找找其他问题了。最后下载了一个ffmpeg编码器,按照另一篇文章里提到的,把一个文件改了读取音频的路径,问题解决
  2. librosa.feature.mfcc 提取出来了mfcc系数,但是不知道该怎么将数据保存下来,于是,又迷茫了。。
    查了一下可以用np.save的方法,用numpy数组来保存。
    为了显示确实提取了,我用了np.load()`import librosa

import librosa.display
import numpy as np

Load a wav file

y, sr = librosa.load(‘your filepath.wav’, sr=None)

extract mel spectrogram feature

wav_feature = librosa.feature.mfcc(y=y, sr=sr,n_mfcc=20)
np.save(‘chosen filepath.npy’,wav_feature)
a=np.load(‘上面设置的文件名.npy’)
print(a)`

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值