【推荐系统（一）】协同过滤之基于领域的方法(UserCF，ItemCF)

最新推荐文章于 2024-08-12 14:30:51 发布

原创

最新推荐文章于 2024-08-12 14:30:51 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#推荐系统 #机器学习 #算法 #人工智能

本文深入探讨了协同过滤中的两种方法：基于用户的协同过滤(UserCF)和基于物品的协同过滤(ItemCF)。UserCF通过寻找兴趣相似的用户进行推荐，而ItemCF则基于用户历史行为推荐相似物品。文章详细介绍了两种方法的计算过程、改进方法及应用场景，并对比了它们的优缺点。UserCF常用于新闻推荐，ItemCF适用于商品和视频推荐。

文章目录

基于用户行为分析的推荐算法一般称为协同过滤算法。所谓协同过滤，就是指众多的用户可以齐心协力，通过不断地和网站互动，使自己的推荐列表能够不断过滤掉自己不感兴趣的物品，从而越来越满足自己的需求。常见实现方法的包括：

基于邻域的方法
隐语义模型
基于图的随机游走算法

本文主要讲解基于邻域的方法，又可以细分为基于用户的协同过滤算法（UserCF）和基于物品的协同过滤算法（ItemCF）。

一、基于用户的协同过滤算法（UserCF）

基于用户是指通过分析用户对商品的行为（如浏览、收藏、加入购物车、购买……）计算出哪些用户是兴趣相似的，然后把兴趣相似的用户所关注的商品相互推荐。

基于用户的协同过滤算法（UserCF）的基本思想：当给用户A推荐时，可以先找到和他有相似兴趣的其他用户，然后把相似用户喜欢的、而用户A没有接触过的物品推荐给A。

UserCF算法分为两个步骤：

找到和目标用户有相似兴趣的用户集合
从集合中找到用户可能喜欢的、但是没有接触过的物品推荐给目标用户

1，找到相似用户

假设有6个用户A_{F，对编号为1}6的物品有不同的行为。不同的行为代表对商品喜爱程度的不同，假设：浏览1分、收藏3分、加入购物车5分、购买10分。

于是可以把不同用户对不同商品的喜爱程度转换为评分矩阵：

用户/商品	1	2	3	4	5	6
A	1		5	3
B		3			3
C	5					10
D	10				5
E			5	1
F		5	3			1

可以看到用户A和B感兴趣的商品完全不同，但是A和E可能有相似的兴趣。为了计算用户之间的相似度，设N(u)为用户 u 有过正反馈的物品集合，N(v) 为用户 v 有过正反馈的物品集合，用户 u 和 v 的兴趣相似度可以用余弦相似度表示：
$\frac{N(u) \cdot N(v)}{\sqrt{|N(u)|\times|N(v)|}}$
当然还有别的计算方法，例如：切比雪夫距离、欧里几得距离、曼哈顿距离、杰卡德距离、皮尔森系数等。