53、音乐分类特征组合研究

音乐分类特征组合研究

1. 音频特征概述

音乐分类是多媒体和信息检索领域的新兴方向,其关键问题在于高效且有效地提取用于高级分类的音频特征。此前的研究中,已使用了多种类型的特征,主要可分为低级特征和中级特征。

  • 低级特征 :常见的低级特征有音色和时间特征,它们通常通过频谱分析提取。提取步骤如下:
    1. 将歌曲分割成小的局部窗口。
    2. 假设每个局部窗口内的截断信号段是平稳的,以应用各种频谱分析技术。
    3. 从每个局部窗口提取标准频谱系数,如快速傅里叶变换系数、梅尔频率倒谱系数(MFCC)、幅度谱包络(ASE)和基于倍频程的频谱对比度(OSC)。
    4. 聚合相邻局部窗口的系数,生成单个歌曲级别的特征。音色特征和时间特征的主要区别在于局部频谱系数的聚合方式,音色特征对系数的分布进行建模,而时间特征将系数视为时间序列数据,关注其时间演变。
  • 中级特征 :如节拍和和弦等中级特征,在一些系统中用于补充或替代低级特征。与低级特征相比,中级特征更易于解释,与人类对音乐的感知联系更紧密,但在音乐分类任务中,中级特征是否优于低级特征仍有待研究。

为了提高音乐分类系统的性能,本文使用了8种单个特征,包括基于三种不同频谱系数的三种音色特征(SMFCC、SASE和SOSC)、基于相同三种系数波动模式的三种时间特征(TMFCC、TASE和TOSC),以及两种中级特征节拍(B)和和弦(C)。

2. 特征组合方法

特征组合方法可

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值