【每周一文】Factorization Meets the Neighborhood：a Multifaceted Collaborative Filtering Model

最新推荐文章于 2023-07-15 01:00:59 发布

原创

最新推荐文章于 2023-07-15 01:00:59 发布 · 4.5k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#推荐算法 #协同过滤 #因子分解 #SVD++ #异步SVD

本文探讨了推荐系统中协同过滤的改进方法，将最近邻模型与因子分解模型相结合，提出了一个兼顾局部和全局的多方面模型。通过改进物品相似度计算、引入隐式反馈数据、学习用户偏置项以及归一化邻域个数，提升了模型性能。同时，介绍了异步SVD和SVD++的优化策略，以适应隐式反馈数据并解决冷启动问题。模型集成进一步提高了推荐效果，尤其是在Netflix数据上的表现。

概述

在推荐系统中，协同过滤（CF：Collaborative Filtering）算法由于其领域无关性以及比较好的推荐效果被广泛使用；
CF模型比较常用的包括最近邻方法和因子分解算法，由于这两种算法各有优缺点；该文提出了一种策略将这两种方法进行综合建模，并且可以适用于隐式反馈数据。

已有模型

最近邻方法

CF常用的有user_based和item_based两个模型，后者由于其推荐效果和可解释性比较强，比较被推荐使用。
item_based方法思路是根据用户个人偏好推荐和这些item最相关的物品。过程如下
1. 根据用户和物品的打分矩阵或者相关数据，计算物品两两之间的相似度 $s(i,j)$ ，常用相似度算法包括皮尔逊系数、jaccard系数
2. 通常情况下相似度计算可能需要大量数据支持，对于稀疏数据需要对数据规模进行置信度加权，常用加权方法可以是 $s_{ij}=\frac{n_{ij}}{n_{ij}+\lambda}p_{ij}$
3. 用户对某物品打分公式为 $r_{ui}=b_{ui}+\frac{\sum_{j\in S_{i;u}^k}s_{ij}(r_{uj}-b_{uj})}{\sum_{j\in S_{i;u}^k}s_{ij}}$ ，其中bui为基准推荐模型，计算公式为bui=μ+bu+bi，即全局偏置+用户偏置+物品偏