推荐系统(3)——最经典的推荐算法(协同过滤算法原理部分)

最新推荐文章于 2025-05-19 09:37:16 发布

挖不动数据的小w

最新推荐文章于 2025-05-19 09:37:16 发布

阅读量1.8k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：推荐系统文章标签：推荐算法算法机器学习大数据

本文链接：https://blog.youkuaiyun.com/qq_41161373/article/details/124794704

4 篇文章

订阅专栏

本文深入探讨了协同过滤推荐算法，包括基于用户和物品的两种类型。算法假设用户喜好相似的人或物品会有共同的兴趣。相似度计算涉及欧氏距离、杰卡德相似度、余弦相似度和皮尔逊相关系数。针对实数值评分和布尔反馈数据，介绍了不同的相似度计算方法，并通过案例解释了如何计算用户和物品的相似度，以及如何生成推荐列表。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

算法思想：物以类聚，人以群分

基本的协同过滤推荐算法基于以下假设：

实现协同过滤推荐有以下几个步骤：

关于相似度计算这里先用一个简单的思想：如有两个同学X和Y，X同学爱好[足球、篮球、乒乓球]，Y同学爱好[网球、足球、篮球、羽毛球]，可见他们的共同爱好有2个，那么他们的相似度可以用：2/3 * 2/4 = 1/3 ≈ 0.33 来表示。

相似度的计算方法

数据分类
- 实数值(物品评分情况)
- 布尔值(用户的行为是否点击是否收藏)
欧氏距离, 是一个欧式空间下度量距离的方法. 两个物体, 都在同一个空间下表示为两个点, 假如叫做p,q, 分别都是n个坐标, 那么欧式距离就是衡量这两个点之间的距离. 欧氏距离不适用于布尔向量之间

欧氏距离的值是一个非负数, 最大值正无穷, 通常计算相似度的结果希望是[-1,1]或[0,1]之间,一般可以使用如下转化公式:

物品相似度计算
- 余弦相似度对绝对值大小不敏感带来的问题
  - 用户A对两部电影评分分别是1分和2分, 用户B对同样这两部电影进行评分是4分,5分用余弦相似度计算,两个用户的相似度达到0.98
  - 可以采用改进的余弦相似度, 先计算向量每个维度上的均值, 然后每个向量在各个维度上都减去均值后,在计算余弦相似度, 用调整的余弦相似度计算得到的相似度是-0.1