协同过滤算法

最新推荐文章于 2025-04-22 15:05:10 发布

我对算法一无所知

最新推荐文章于 2025-04-22 15:05:10 发布

阅读量1.5k

点赞数

分类专栏：历程文章标签：推荐系统

本文链接：https://blog.youkuaiyun.com/qq_31267769/article/details/107780124

版权

本文详细介绍了协同过滤算法，从用户反馈构建共现矩阵，到用户相似度计算，包括余弦相似度、Pearson相关系数及其改良版。接着讨论了最终结果的排序方法，以及UserCF和ItemCF的优缺点和应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（自读王喆老师《深度学习推荐系统》笔记）

1 协同过滤

协同过滤就是协同别人的feedback，对信息进行过滤，从而选出某个用户可能感兴趣的信息。比如，某宝、某东的推荐页面，就是通过协同跟你自己相似用户的购买信息、评价和反馈，然后从所用商品中过滤出你可能感兴趣的东西推荐给你，简化的大致描述就是这样，可能会有出入，具体的详细算法流程后面会说。

推荐过程一共分为几个步骤：

获取所有物品的用户反馈，包括点赞、评价等等。
以上数据存储为矩阵形式，用户为行坐标，物品为列坐标，例如只统计点赞的数据，将点赞设为1，点踩设为-1，没有点赞或者点踩的设为0。这个矩阵被称为“共现矩阵”。
比如目标是预测用户c 对物品a 是否喜欢，由此就问题就转换为计算 (用户c , 物品a) 坐标上的数值，接近1就是喜欢，接近-1就是不喜欢。
计算每个用户跟目标用户的相似度，选出相似度最大的 Top $n$ 个用户，然后根据这 $n$ 个用户对目标商品的点赞情况，来预测目标用户对这个物品是否感兴趣。
如果预测接近1，则推荐；如果预测接近-1，则不推荐。

这是协同过滤算法的流程，但是其中模糊了几个点，比如如何计算用户的相似度，如何根据相似用户的feedback来计算目标用户的喜好程度，为什么以用户为行坐标，物品为列坐标构建共现矩阵等等，后面我会一一解释。

2 用户相似度计算

在协同过滤算法中，可通过上面的流程看出，相似度计算十分关键，他决定了具体选取哪些用户来确定目标用户的喜好程度。

2.1 余弦相似度

在共现矩阵中，所用行和列都可以做为一个向量，因此行向量也就是一个表示用户的向量，这个向量中包括了他对各种物品喜欢或者不喜欢的评价，所以这个向量可以看做是对用户的兴趣的一个描述。因为我们可以计算不同用户向量的夹角，夹角的大小用来表示两用户的相似程度。是用初中数学的知识我们可以得到如下公式：

$sim=\cos \left( \theta \right) =\frac{\overrightarrow{a}\cdot \overrightarrow{b}}{\lVert \overrightarrow{a} \rVert \cdot \lVert \overrightarrow{b} \rVert}$

2.2 Pearson相关系数

最低0.47元/天解锁文章