音乐音色特征分析构建用户特定情感模型
音乐情感识别是一个旨在研究计算机、情感和音乐之间关系的领域。个人经历会影响对音乐的反应,提取音乐特征有助于评估音乐传达的情感,进而根据用户情绪推荐音乐。音乐能表达和诱发情感,其特征可用于检测情感,然而音色与情感的关系尚未深入研究。本文将分析五种音色特征,使用四种分类器,以确定构建用户特定情感模型的最佳乐器和分类器。
1. 音乐情感识别概述
音乐情感识别研究计算机、情感与音乐的关系。个人经历对音乐反应影响大,提取音乐特征可评估情感,辅助音乐推荐。音乐能表达和诱发情感,可通过生理信号测量。此前研究聚焦古典音乐产生的悲伤、恐惧和快乐三种情感,发现大脑状况也会影响反应。
音乐有多种特征可检测情感,如诺基亚研究等合作项目提供了全面的音乐特征集,Levy和Sandler将其分为节奏、音色和能量、和声和旋律、结构特征四类。尽管已有音色相关研究,但音色与情感的具体关系仍不明确。
2. 音色特征介绍
使用开源音乐特征提取程序jAudio提取五种音色特征的子特征,共60个子特征。具体特征如下:
- Mel频率倒谱系数(MFCC) :在乐器音色识别中准确率高。算法将信号分割成短重叠帧,计算每帧的MFCC形成特征向量,再计算其分布的统计模型。MFCC是在Mel频带上计算的倒谱,第一个系数与信号能量成正比不存储,后12个系数存储。转换公式为从线性频率值ƒ到Mel值$m = log_{10}(1 + \frac{f}{700})$,线性频率谱值在Mel尺度均匀分布的三角窗中积分。
- 频谱质心 :定义为信号幅度谱的重心,公式为[具体
超级会员免费看
订阅专栏 解锁全文
601

被折叠的 条评论
为什么被折叠?



