音乐分类特征组合研究
1. 音频特征概述
音乐分类是多媒体和信息检索领域的新兴方向,其关键问题在于高效且有效地提取用于高级分类的音频特征。此前的研究中,已使用了多种类型的特征,主要可分为低级特征和中级特征。
- 低级特征 :常见的低级特征有音色和时间特征,它们通常通过频谱分析提取。提取步骤如下:
- 将歌曲分割成小的局部窗口。
- 假设每个局部窗口内的截断信号段是平稳的,以应用各种频谱分析技术。
- 从每个局部窗口提取标准频谱系数,如快速傅里叶变换系数、梅尔频率倒谱系数(MFCC)、幅度谱包络(ASE)和基于倍频程的频谱对比度(OSC)。
- 聚合相邻局部窗口的系数,生成单个歌曲级别的特征。音色特征和时间特征的主要区别在于局部频谱系数的聚合方式,音色特征对系数的分布进行建模,而时间特征将系数视为时间序列数据,关注其时间演变。
- 中级特征 :如节拍和和弦等中级特征,在一些系统中用于补充或替代低级特征。与低级特征相比,中级特征更易于解释,与人类对音乐的感知联系更紧密,但在音乐分类任务中,中级特征是否优于低级特征仍有待研究。
为了提高音乐分类系统的性能,本文使用了8种单个特征,包括基于三种不同频谱系数的三种音色特征(SMFCC、SASE和SOSC)、基于相同三种系数波动模式的三种时间特征(TMFCC、TASE和TOSC),以及两种中级特征节拍(B)和和弦(C)。
2. 特征组合方法
特征组合方法可
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



