librosa，melspectrogram初阶

最新推荐文章于 2025-09-10 00:25:22 发布

原创最新推荐文章于 2025-09-10 00:25:22 发布 · 1w 阅读

12 ·

CC 4.0 BY-SA版权

本文介绍了使用Python库Librosa进行音频文件加载及梅尔频谱图特征提取的方法。展示了如何通过设置参数来获取特定形状的频谱图，并提供了计算输出尺寸的公式。

部署运行你感兴趣的模型镜像

import librosa
import librosa.display
y, sr = librosa.load('E:\\ML\\UrbanSound8K\\code\\UrbanSound8K\\audio\\fold1\\31840-3-0-0.wav', duration=2.97)
ps = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128)
ps.shape

输出图形的长为128，高为128
输出长度= （秒）*（采样率）/（hop_length）
输出高度= n_mels（你指定的阶数）

librosa.feature.melspectrogram(y=None, sr=22050, S=None, n_fft=2048, hop_length=512, power=2.0, **kwargs)

参考文章：
https://librosa.github.io/librosa/generated/librosa.feature.mfcc.html?highlight=n_mels
http://mhy12345.xyz/tutorials/librosa-samples/
https://stackoverrun.com/cn/q/10464124

您可能感兴趣的与本文相关的镜像

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

岚DEMO

关注关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

librosa.feature.melspectrogram()

weixin_42187536的博客

12-07

8200

计算Mel scaled 频谱 librosa.filters.mel(sr, n_fft, n_mels=128, fmin=0.0, fmax=None, htk=False, norm=1) 创建一个滤波器组矩阵以将FFT合并成Mel频率参数： sr ：输入信号的采样率 n_fft ：FFT组件数 n_mels ：产生的梅尔带数 fmin ：最低频率（Hz） fmax：最高频率（以Hz为单位）。如果为None，则使用fmax = sr / 2.0 norm：{None，1，np.in

librosa 语音库（三） librosa.feature. 中的 spectrogram 与 melspectrogram

chumingqian的博客

05-17

9040

窗口的长度与 n_fft 需要匹配大小长度； 1. Mel 语谱图的函数定义 librosa.feature.melspectrogram(函数在spectral.py 中，实现过程为： def melspectrogram(y=None, sr=22050, S=None, n_fft=2048, hop_length=512, power=2.0, **kwargs): S, n_fft = _spectrogram(y=y, S=S, n_fft=n_f

3 条评论您还未登录，请先登录后发表或查看评论

深度学习（PyTorch）——librosa库的使用

qq_42233059的博客

10-04

6172

深度学习（PyTorch）——librosa库的使用

librosa完全指南：从安装到高级音频特征提取

gitblog_00800的博客

09-10

1263

你是否曾因音频特征提取的复杂流程而却步？是否在寻找一个能够一站式处理音频加载、特征提取、节拍检测和频谱分析的Python库？librosa（发音为/liːˈbroʊsə/）正是为解决这些问题而生。作为Python中最流行的音频分析库之一，librosa提供了简洁而强大的API，让音频处理变得前所未有的简单。读完本文，你将能够： - 快速安装并配置librosa环境 - 掌握音频文件的加载与基本...

C/C++实现librosa音频处理库melspectrogram和mfcc

AI吃大瓜的博客

08-04

6689

本项目使用C/C++实现Python音频处理库librosa中melspectrogram和mfcc的计算,项目将对齐Python音频处理库librosa； Mel频谱图（Mel Spectrogram）和Mel频率倒谱系数（Mel Frequency Cepstrum Coefficient, MFCC） librosa.load：实现语音读取 librosa.feature.melspectrogram：实现计算melspectrogram librosa.feature.mfcc：实现计算MFCC

利用librosa,torchaudio分别实现梅尔语谱图（Mel spectrogram ）音频特征提取的详细过程

qq_57540674的博客

01-23

7481

用不同的方式实现音频到梅尔谱的转变，如torchaudio，librosa，直接调用和分步实现，把音频的特征值提取出来，可用于音频分类。

librosa.feature.melspectrogram() 梅尔频谱图示例

weixin_44493841的博客

01-21

8728

librosa.feature.melspectrogram() 梅尔频谱图示例 import librosa y, sr = librosa.load( librosa.ex('nutcracker'), # 音频路径( librosa.ex('nutcracker') 可换成：1.wav ) sr = 18000, # 设置输出采样率，默认是22050 duration = 1 # 截取时长为1秒 ) print(y.shape) # 音频时间序列 (18000,)

数据结构初阶小白笔记~

最新发布

11-29

数据结构是计算机科学中关于如何组织和存储数据的基本概念，它决定了数据元素之间所形成的特定关系的集合。为了适应不同应用场景，需要学习多种数据结构，包括但不限于线性表、树、图和哈希等。...

精选资源

C语言初阶指针.zip

01-14

本资料"《C语言初阶指针》"将帮助初学者理解这一关键概念。首先，我们要知道什么是指针。指针变量是一个特殊的变量，它存储的是另一个变量的地址，即内存中的位置。在C语言中，通过使用`*`运算符，我们可以声明一...

图形初阶_R语言_图形初阶_

10-03

`Chapter03 图形初阶.R`文件很可能是本教程的一个实际操作示例，里面可能包含了具体的代码和注释，指导学习者如何使用`barplot()`和`boxplot()`函数。建议打开这个文件，跟随代码步骤进行实践，以加深对这两个图形的...

基于JavaEE技术的初阶JavaEE项目设计源码

09-27

该初阶JavaEE项目设计源码是一个非常有教育意义的资源，它以实际项目的形式向学习者展示了JavaEE的架构和开发流程。通过研究这些文件，初学者可以逐步理解并掌握从后端数据处理到前端用户界面展示的整个过程，以及...

python下wav音频文件绘制melspectrogram

03-26

从文件夹中载入wav音频文件，根据音频文件绘制出相应的melspectrogram

ERP初阶

12-16

ERP初阶以实践认知世界，以实事构架世界，ERP初阶总能给你最需要、最实用、最真实的，喜欢的朋友欢迎下载...该文档为ERP初阶，是一份很不错的参考资料，具有较高参考价值，感兴趣的可以下载看看

torchaudio 和 librosa 库中提取 Mel Spectrogram 的相互转换

weixin_43335465的博客

02-08

2049

torchaudio 和 librosa 是深度学习中语音特征提取最常见的两个库，但是针对同样的特征两个库在提取 MelSpectrogram 特征的时候，得到的结果并不完全一致，这篇文章简述了一些配置和注意事项，从而使得两个库能够提取相同数值大小的特征。

librosa绘制音频图

qq_40703471的博客

03-06

2840

librosa绘制音频图今天偶然发现librosa库可以绘制音频特征相关图，作下记录和总结。 import librosa.display import numpy as np import matplotlib.pyplot as plt # 这里插入提取音频的路径 y, sr = librosa.load(librosa.util.example_audio_file()) # 使用stft频谱求Mel频谱 D = np.abs(librosa.stft(y)) ** 2 # stft频谱 S

时频转换 | Matlab梅尔频谱图Mel spectrogram一维数据转二维图像方法

默默科研仔的博客

02-18

1042

### 时频转换 | Matlab梅尔频谱图Mel spectrogram一维数据转二维图像方法 #### 一、引言 ##### 1.1、研究背景及意义时频转换是信号处理领域中一个至关重要的技术，它能够将一维的时间域信号转换为二维的时频域表示，从而揭示信号在时间和频率两个维度上的特性。这种转换对于分析非平稳信号尤为重要，因为这些信号的频率成分随时间变化而变化。在众多时频转换工具中，梅尔频谱图（Mel spectrogram）因其独特的设计而广泛应用于音频信号处理领域。梅尔频谱图基于人耳的听觉感知特性

MATLAB语音信号——语音信号的Mel spectrogram（梅尔频谱图）计算