基于深度学习的音乐推荐与智能座椅姿势检测技术
基于面部表情的深度学习音乐推荐
在情感识别与音乐推荐领域,研究人员开发了基于深度学习的系统,利用FER - 2013和RAVDESS数据集进行情感识别,并根据识别结果推荐音乐。
数据集与性能指标
- FER - 2013数据集 :CNN架构使得数据解读变得简单。通过图7中的准确率曲线,可以看到不同训练轮次下的训练和验证准确率。同时,还能绘制类激活图,这些图展示了最终卷积层激活的像素。研究发现,不同的情感标签下,像素的响应不同。例如,快乐情绪似乎与眼睛和嘴唇相关的像素有关,而悲伤或愤怒则与眉毛的像素更相关(如图8所示)。
- RAVDESS数据集 :图9展示了该数据集在不同训练轮次下的训练和验证准确率。
网络应用结果
用户可以在界面(图10)上选择“录制视频”或“录制音频”按钮。
- 录制视频 :选择“录制视频”选项后,点击“开始录制”按钮,即可开始录制约15秒的视频。视频会保留面部表情和情感分布。图11展示了面部表情的分布以及根据最常见表情给出的音乐推荐。
- 录制音频 :选择“录制音频”选项后,点击“开始录制”按钮,15秒后可开始音频录制。15秒后选择“获取推荐音乐”按钮,即可显示结果。图12展示了语音情感的分布以及根据最常见情感给出的音乐推荐。
在情感识别方面,利用RAVDESS数据集开发了CNN - LSTM语音情感识别模块,利用FER数据集(Xce
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



