19、音频频谱图的数据增强与表格数据增强

音频频谱图的数据增强与表格数据增强

1. 音频频谱图数据增强

在音频处理中,频谱图是一种强大的工具,可用于可视化音频的频率内容。音频频谱图、Mel频谱图和Chroma STFT是常见的音频可视化方式。

1.1 频谱图生成与保存

当生成新的图像或图表时,会自动将图像文件写入或导出到 ~/Data-Augmentation-with-Python/pluto_img 目录。例如,之前章节中的增强图像、波形图、音频频谱图、Mel频谱图和Chroma STFT图表都会自动保存。辅助函数 _drop_image() 会以 pluto[id].jpg 的格式保存文件,其中 id self.fname_id 变量的自增整数。

1.2 频谱图增强技术

频谱图增强可以复用之前章节的大部分包装函数。经过研究发现,之前章节的音频增强技术同样适用于音频频谱图、Mel频谱图和Chroma STFT,包括以下技术:
- 时间拉伸(Time-stretching)
- 时间移位(Time-shifting)
- 音高缩放(Pitch-scaling)
- 噪声注入(Noise injection)
- 极性反转(Polarity inversion)
- 低通滤波器(Low-pass filter)
- 高通滤波器(High-pass filter)
- 带通滤波器(Ban-pass filter)
- 低架滤波器(Low

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值