39、机器学习在音乐信息检索中的应用

机器学习在音乐信息检索中的应用

1. 引言

互联网的快速发展和技术进步,让音乐听众能够获取海量在线音乐数据,涵盖音乐信号、歌词、传记和唱片目录等。如今,音乐艺术家通过各种网站进行推广,他们也成为网络新闻组和论坛的讨论话题。这引发了一个问题:计算机程序能否通过让听众访问大量在线音乐数据,来丰富他们的音乐体验?

音乐的主要功能具有社交和心理属性,其特征可基于流派、情感、风格和相似度这四类信息进行描述。这四类特征相互关联,例如特定情感标签常用于特定音乐流派,风格通常在流派内定义,相似音乐往往具有相同流派、风格和情感标签。不过,情感标签具有主观性,流行音乐风格可能不仅取决于声音信号,还与歌词创作方式有关,这可能超出了声音特征提取算法的能力范围。

接下来将介绍用于识别上述四种音乐特征的机器学习方法,包括用于音乐流派分类的多类分类、用于情感检测的多标签分类、用于音乐风格识别的聚类以及用于音乐推荐的半监督学习。

2. 音乐特征提取

在音乐信息检索中应用机器学习方法之前,关键步骤是确定从音乐数据中提取的特征。所有机器学习方法都会利用从音乐音频信号中提取的内容特征,此外,在音乐风格识别中,还会使用基于歌词的文本特征。

2.1 内容特征提取

从音乐信号中提取描述性特征用于音乐流派分类和艺术家识别已有大量研究。本研究使用音色特征和小波系数直方图。
- Mel - 频率倒谱系数(MFCC) :在语音处理中非常流行,用于捕捉短期频谱特征。计算步骤如下:首先,对每一帧,计算基于短期傅里叶变换的幅度谱的对数,使用Mel频率标度将频率分为十三个区间;然后,使用离散余弦变换对该向

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值