机器学习在音乐信息检索中的应用
1. 引言
互联网的快速发展使音乐听众能够获取海量在线音乐数据,如音频信号、歌词、传记和唱片目录等。如今,音乐艺术家通过各种网站进行推广,也成为网络讨论的热门话题。这引发了一个问题:计算机程序能否帮助听众更好地利用这些海量音乐数据?多媒体会议如 ISMIR 和 WEDELMUSIC 聚焦于音乐数据分析、总结、索引和分类的计算技术开发。
Huron 指出,音乐的突出功能具有社交和心理属性,其最有用的特征可基于四种信息:流派、情感、风格和相似度。这四种特征相互关联,例如特定情感标签常用于特定音乐流派,风格通常在流派内定义,相似音乐往往属于同一流派、风格且具有相同情感标签。不过,情感标签具有主观性,音乐风格的定义可能不仅取决于声音信号,还与歌词创作方式有关,这可能超出了声音特征提取算法的能力范围。
本文将探讨用于识别上述四种音乐特征的机器学习方法,具体包括:
1. 用于音乐流派分类的多类分类方法。
2. 用于情感检测的多标签分类方法。
3. 用于音乐风格识别的聚类方法。
4. 用于音乐推荐的半监督学习方法。
2. 音乐特征提取
在音乐信息检索中应用机器学习方法之前,关键步骤是确定从音乐数据中提取的特征。本文讨论的机器学习方法主要利用从音乐音频信号中提取的内容特征,同时在音乐风格识别中还会使用基于歌词的文本特征。
2.1 内容特征提取
已有大量研究致力于从音乐信号中提取描述性特征,用于音乐流派分类和艺术家识别。本文使用音色特征和小波系数直方图。
- Mel - 频率倒谱系数(MFCC)
超级会员免费看
订阅专栏 解锁全文
1752

被折叠的 条评论
为什么被折叠?



