26、频谱图层次聚类方法解析

频谱图层次聚类方法解析

一、相关研究工作

在音乐分析领域,以往的研究主要集中在音乐结构检测与提取以及音乐分类两个方面。
1. 音乐结构检测与提取
- Chen和Li的方法 :将音乐音频分解为不同的片段,如前奏、主歌、桥段和尾奏等。他们分别利用基于色度特征的和声信息和基于MFCC的音色信息来生成片段标签,引入新的表示得分矩阵来整合和声和音色这两个不同方面的信息,最后通过非负矩阵分解(NMF)将得分矩阵分解为片段类型模板和时间激活的乘积。
- McFee和Ellis的方法 :提出一种紧凑表示方法,用于在多个粒度级别上有效编码歌曲中的重复结构。首先生成由音频级特征(如色度图和MFCC序列)组成的二进制递归矩阵,使用和声特征检测长期重复,音色特征检测局部一致性。然后开发样本之间的内部局部和长期连接性,最终通过平衡局部和全局链接获得编码重复结构的序列增强亲和矩阵。
- Ullrich等人的方法 :使用卷积神经网络(CNN)直接学习带有人类注释的Mel尺度幅度频谱图集。他们认为许多现有的音乐分割算法几乎是手工设计的,需要大量的微调来优化性能,而CNN的监督学习在无需领域知识的情况下优于手工设计的算法,因为CNN可以自行识别与音乐分割相关的特征。
2. 音乐分类
- Costa等人的方法 :采用灰度共生矩阵(GLCM)和局部二值模式(LBP)作为纹理特征进行自动音乐流派分类。他们使用了Haralick提出的14种属性中的7种,即熵、相关性、同质性、三

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值