概述
在推荐系统中,协同过滤(CF:Collaborative Filtering)算法由于其领域无关性以及比较好的推荐效果被广泛使用;
CF模型比较常用的包括最近邻方法和因子分解算法,由于这两种算法各有优缺点;该文提出了一种策略将这两种方法进行综合建模,并且可以适用于隐式反馈数据。
已有模型
最近邻方法
CF常用的有user_based和item_based两个模型,后者由于其推荐效果和可解释性比较强,比较被推荐使用。
item_based方法思路是根据用户个人偏好推荐和这些item最相关的物品。过程如下
1. 根据用户和物品的打分矩阵或者相关数据,计算物品两两之间的相似度s(i,j),常用相似度算法包括皮尔逊系数、jaccard系数
2. 通常情况下相似度计算可能需要大量数据支持,对于稀疏数据需要对数据规模进行置信度加权,常用加权方法可以是sij=nijnij+λpij
3. 用户对某物品打分公式为rui=bui+∑j∈Ski;usij(ruj−buj)∑j∈Ski;usij,其中bui为基准推荐模型,计算公式为bui=μ+bu+bi,即全局偏置+用户偏置+物品偏

本文探讨了推荐系统中协同过滤的改进方法,将最近邻模型与因子分解模型相结合,提出了一个兼顾局部和全局的多方面模型。通过改进物品相似度计算、引入隐式反馈数据、学习用户偏置项以及归一化邻域个数,提升了模型性能。同时,介绍了异步SVD和SVD++的优化策略,以适应隐式反馈数据并解决冷启动问题。模型集成进一步提高了推荐效果,尤其是在Netflix数据上的表现。
最低0.47元/天 解锁文章
289

被折叠的 条评论
为什么被折叠?



