推荐系统常用的数据集

本文介绍了推荐系统中常用的数据集,重点分析了MovieLens数据集,包括其包含的用户评分、标签评分及标签基因数据。同时,文章还提供了一个基于此数据集的简单实验参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  在这篇博客中主要会罗列一下推荐系统中需要中研究和开发可能会用到的数据集,这个博客日常更新所用到或者接触到的数据集,每个数据集的内容主要包括两个部分:

  • 数据集的简单介绍
  • 涉及到的使用了这个数据集的可复现简单实验

如果有优快云er有好的数据集推荐或者新出的数据集可以在下方留言,欢迎讨论。

1 MovieLens

1.1 数据集介绍

MovieLens 数据集链接

  MovieLens数据集主要提供了四个可供利用的数据集:

  • recommended for new research
    MovieLens 25M 数据集是一个稳定的基准数据集,这个数据集中包含了13.8万用户对2.7万个电影的2000万的评分数据和46.5万的标签评分数据。此外这个数据集中还包含了在1129个标签之间150万的标签基因数据。

  • recommended for education and development

  • synthetic datasets

  • older datasets

1.2 相关数据集上的实验

参考链接

【1】MovieLens 数据集地址
【2】MovieLens 网站

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值