基于MoviesLens 1M数据集的电影推荐——协同过滤推荐算法

最新推荐文章于 2025-06-08 09:18:14 发布

chosethisway

最新推荐文章于 2025-06-08 09:18:14 发布

阅读量4k

点赞数 7

CC 4.0 BY-SA版权

分类专栏： Python 文章标签：协同推荐算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38960965/article/details/83412242

本文介绍了基于用户协同过滤推荐算法在MoviesLens 1M数据集上的应用。首先，通过计算用户间相似度并选取相似度最高的用户集合，然后排除已观看电影，加权计算未观看电影的推荐分数，最终形成推荐列表。文中还提供了Python源代码实现，并提到了数据预处理和pandas库的使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于用户的协同过滤推荐：

目标：针对任意用户，为其推荐没有看过但是可能想看的电影（其他物品）

协同过滤推荐过程：

假设我们要为用户甲推荐电影

Step1 - 找到与阿具有相同电影偏好的用户集合S.

对一个与除一个以外的所有用户进行相似度计算
对计算结果进行排序，选取相似度排名前Ñ的Ñ位用户构成电影偏好相同的用户集合小号

Step2--基于用户集合小号进行加权推荐

将用户集合小号中甲看过的电影删除，仅考虑一个没有看过的电影
用户集合小号中每个用户的硅的权重的无线网络为硅与甲的相似度
计算电影狄加权得分 - 用户集合小号中每个用户的Si对电影迪的评分乘以权重无线，然后求和（没有评分则评分置0）
对电影的加权得分进行排序，选取得分排名前Ñ的Ñ部电影构成电影推荐集合

具体的协同推荐算法讲解可以参考博客：https：//blog.youkuaiyun.com/yimingsilence/article/details/54934302

基于MoviesLens 1M数据集的电影推荐python源程序：

实现第一步的准备

由于数据比较大，为了使推荐程序运行速度快，我们事先建立一个每个用户所看电影类型频数的统计表：

用户身份

戏剧

记录

惊悚

战争

儿童

恐怖

幻想

西

行动

浪漫

冒险

犯罪

神秘

科幻</

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。