movielens推荐系统_必存干货|基于ItemCF和DeepFM的电影推荐项目

本文详细介绍了基于MovieLens数据集的电影推荐系统实现,涵盖数据下载、文件说明、算法原理(ItemCF召回算法与DeepFM排序算法)以及项目实现步骤。通过对用户评分数据、用户和电影属性的理解,利用协同过滤和深度学习方法,实现高效精准的电影推荐。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、数据介绍

MovieLens数据集是一个关于推荐系统中常用的电影评分数据集,本文选取了其中的ml-1m数据集,如图所示:

cc46e823315c9af0f850327a1ec35ced.png

1. 数据下载 

在当前路径下新建data文件夹,并将数据集下载解压至此处。数据集下载的地址为:http://files.grouplens.org/datasets/movielens/ml-1m.zip

2. 文件说明

数据下载后会产生一个data文件夹和一个ml-1m子文件夹,子文件夹ml-1m中包含了四个文件:README、ratings.dat、movies.dat、users.dat,其中README文件是对该数据集的整体介 绍,内容如下:

2.1 概述 

这些文件包含了6040名用户对大约3900部电影的1000209条评分记录

2.2 ratings.dat

该文件存放电影评分数据,格式为 UserID::MovieID::Rating::Timestamp 

  • UserID 取值范围:1-6040

  • MovieID 取值范围:1-3952

  • Ratings 取值范围:1-5

  • Timestamp 表示格林威治时间1970年01月01日00时00分00秒(北京时间1970年01

  • 月01日 08时00分00秒)起至现在的总毫秒数。

  • 每个用户至少有20条评分记录

2.3 users.dat

该文件存放用户属性数据,格式为 UserID::Gender::Age::Occupation::Zip-code

  • Gender 用“M”表示男性,“F”表示女性 

  • Age 各个取值对应不同的年龄区间

    • 1: "Under 18"

    • 18: "18-24"

    • 25: "25-34"

    • 35: "35-44"

    • 45: "45-49"

    • 50: "50-55"

    • 56: "56+"

  • Occupation 各个取值对应不同的职业

    • 0: "other" or not specified

    • 1: "academic/educator"

    • 2: "artist"

    • 3: "clerical/admin"

    • 4: "college/grad student"

    • 5: "customer service"

    • 6: "doctor/health care"

    • 7: "executive/managerial" 8: "farmer"

    • 9: "homemaker"

    • 10: "K-12 student"

    • 11: "lawyer"

    • 12: "programmer"

    • 13: "retired"

    • 14: "sales/marketing"

    • 15: "scientist"

    • 16: "self-employed"

    • 17: "technician/engineer" 18: "tradesman/craftsman" 19: "unemployed"

    • 20: "writer"

该文件存放电影属性数据,格式为 MovieID::Title::Genres

  • Titles 电影标题

  • Genres 电影题裁,共18个取值

    • Action 

    • Adventure 

    • Animation 

    • Children's 

    • Comedy 

    • Crime 

    • Documentary 

    • Drama 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值