机器学习在音乐信息检索中的应用
1. 引言
互联网的快速发展和技术进步,让音乐听众能够获取海量在线音乐数据,涵盖音乐信号、歌词、传记和唱片目录等。如今,音乐艺术家通过各种网站进行推广,他们也成为网络新闻组和论坛的讨论话题。这引发了一个问题:计算机程序能否通过让听众访问大量在线音乐数据,来丰富他们的音乐体验?
音乐的主要功能具有社交和心理属性,其特征可基于流派、情感、风格和相似度这四类信息进行描述。这四类特征相互关联,例如特定情感标签常用于特定音乐流派,风格通常在流派内定义,相似音乐往往具有相同流派、风格和情感标签。不过,情感标签具有主观性,流行音乐风格可能不仅取决于声音信号,还与歌词创作方式有关,这可能超出了声音特征提取算法的能力范围。
接下来将介绍用于识别上述四种音乐特征的机器学习方法,包括用于音乐流派分类的多类分类、用于情感检测的多标签分类、用于音乐风格识别的聚类以及用于音乐推荐的半监督学习。
2. 音乐特征提取
在音乐信息检索中应用机器学习方法之前,关键步骤是确定从音乐数据中提取的特征。所有机器学习方法都会利用从音乐音频信号中提取的内容特征,此外,在音乐风格识别中,还会使用基于歌词的文本特征。
2.1 内容特征提取
从音乐信号中提取描述性特征用于音乐流派分类和艺术家识别已有大量研究。本研究使用音色特征和小波系数直方图。
- Mel - 频率倒谱系数(MFCC) :在语音处理中非常流行,用于捕捉短期频谱特征。计算步骤如下:首先,对每一帧,计算基于短期傅里叶变换的幅度谱的对数,使用Mel频率标度将频率分为十三个区间;然后,使用离散余弦变换对该向
超级会员免费看
订阅专栏 解锁全文
1742

被折叠的 条评论
为什么被折叠?



