由于毕业论文打算做音乐推荐相关的研究,所以有一段时间都花在了音乐数据集的调研上。几经探索,终于找到一个满足自己需求的公开数据集:Million Song Dataset(MSD)。
MSD简介
与其说MSD是一个数据集,还不如说它是一个资源整合平台。它搜集了来自SecondHandSongs dataset 、Last.fm dataset 等7个知名并且权威的音乐社区的数据。当中除了各大音乐网站的原始数据外,MSD还对它们进行了必要的分析和提取;同时也通过MSD自有的track_id来对各大平台的数据进行匹配。MSD包含的数据量和信息量都很多,只要愿意去挖掘,应当能够从中获益。
本文介绍了MillionSongDataset(MSD),这是一个整合了多个音乐社区数据的资源平台。MSD不仅收集原始数据,还进行了分析提取,并通过独有的track_id实现跨平台数据匹配,为音乐推荐系统的研究提供了丰富的数据支持。
371

被折叠的 条评论
为什么被折叠?



