ESC-50数据集的分析(1)

本文探讨了音频特征如MFCC在单个音频片段上的分布及不同类别间的对比,通过箱图展示了特征的有效性和区分度,强调了MFCC1和过零率在声音分类中的重要性。
单个音频波形图和对应声谱图的可视化|特征可视化

原始资料来自原作者的jupyter notebook[jupyter]

这里的一些可视化工具,可能可以用来新的数据集分析,以及算法性能比较。

本人誊写的代码在这里[source]

单个音频波形图和对应声谱图的可视化

单个音频波形图和对应声谱图

特征可视化

这里是用来分析所使用的音频特征的区分度(有效性)。可视化的方法有很多,但是背后其实是降维。以常用的音频特征MFCC为例,首先看一下在单个音频clip上的分布表现。这里用的seaborn的boxplot实现了一个特征分布的箱图。箱图是一个看起来高大上的统计指标,主要用来表征数据的分布情况。和简单的使用均值和方差相比,箱图可以反映更多的信息。seaborn是matplotlib的高级封装版,仅此而已。
单clip特征箱图

注意 M F C C 0 MFCC_0

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值