FMA: 音乐分析数据集项目推荐
fma 项目地址: https://gitcode.com/gh_mirrors/fm/fma
1. 项目基础介绍和主要编程语言
FMA(Free Music Archive)是一个用于音乐分析的开源数据集项目,由Michaël Defferrard等人开发。该项目的主要编程语言是Python,适合用于音乐信息检索(MIR)领域的研究。FMA数据集包含了大量的音乐文件和相关元数据,适用于多种音乐分析任务。
2. 项目核心功能
FMA项目提供了以下核心功能:
- 音乐数据集:包含917 GiB和343天的Creative Commons许可音频,来自106,574首曲目、16,341位艺术家和14,854张专辑,按161种流派分类。
- 元数据和特征:提供完整的曲目和用户级元数据、标签和自由文本(如传记),以及预计算的音频特征。
- 数据集分割:提供训练/验证/测试集的建议分割,以及三个子集(小、中、大),适合不同规模的研究需求。
- 基准模型:提供用于流派识别的基准模型,包括从音频和特征中提取的模型。
- 代码和示例:提供Python代码和Jupyter Notebook示例,展示如何加载数据集、开发和测试自定义模型。
3. 项目最近更新的功能
截至最新更新,FMA项目的主要更新包括:
- 数据集扩展:增加了更多的音乐曲目和元数据,扩展了数据集的规模和多样性。
- 特征提取工具:更新了特征提取工具,支持更多类型的音频特征提取,如使用librosa库提取的常见特征。
- 基准模型优化:对现有的基准模型进行了优化,提高了流派识别的准确性和效率。
- 文档和示例更新:更新了使用文档和Jupyter Notebook示例,提供了更详细的指导和更丰富的示例代码。
FMA项目是一个非常适合音乐分析和机器学习研究的开源数据集,提供了丰富的资源和工具,帮助研究人员和开发者更好地进行音乐相关的研究和应用开发。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考