题目: 基于标签深度分析的音乐自动标注算法
作者: 萧永乐
单位: 华南理工大学工程硕士学位论文
出版: 未出版
-------------
问题:文章重点解决什么问题。
真实音乐标注数据集存在大量标签噪声,影响音乐自动标注深度网络在训练和分析过程的可靠性,导致自动标注效果较差。噪声的不良印象无法直接通过深度神经网络结构优化解决。
1)音乐自动标注与音乐标签。
音乐自动标注网络创建一个规模足够大的音乐标注数据集难度很大。
音乐自动标注经常被认为无法完全正确定义的预测问题,因为用户对音乐的标注是主观的,并且可以使用几乎无限数量的有意义的标签对音乐进行描述。
音乐自动标注是一个多类标分类分体。
音乐标注数据集的分析同事需要关注音乐标签的流行程度,因为标注数据集中标签通常分布不均匀,很多不常用的标签会构成长尾问题。
2)标注策略
数据集中的音乐可能在几个不同的角度被“强”标注或“弱”标注。大部分的真实标注数据集都是弱标注数据集。
不同标签表现有差异。
方案:侧重整体性的系统架构或评价体系等。
1)对一个大规模的音乐标签数据集进行分析,并研究标签噪声对卷积神经网络的影响,深入了解其中特性。研究发现标签噪声使网络在训练过程学习到梗发散的映射关系,导致最终标签效果差。
2)提出标签向量概念,并验证其合理性于有效性。根据数据集于音乐标签分析结果定义标签向量,挖掘音乐标签于音频之间的深层信息,并将标签向量用于音乐自动标签任务。
3)提出基于标签深度分析的音乐标注算法。算法题曲音频多层级特征,结合标签向量,提高音乐自动标注深度网络对标签噪声的鲁棒性,在真实标注数据集上得到更好的表现。
分析原因
解决标签噪声:
1)分析标签错误率来测量百万音乐数据集的标签噪声
2)预测正面标签的准确数量