《Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model》经典论文阅读

本文探讨了通过融合潜在因子模型和邻域模型来提高推荐系统精度的方法。结合用户显式和隐式反馈,提出了一个更精准的组合模型,旨在解决最近邻方法的局部最优解问题和因子分解模型的可解释性不足。新模型通过SVD++和最近邻模型的隐式整合,实现了三层模型的累加:基准模型、因子分解模型和最近邻模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章主要研究点

  • 本文的对潜在因子模型和邻域模型进行了平滑合并,目的:建立更精确的组合模型,利用用户显式和隐式反馈进一步提高了精度
  • 在top-K推荐任务中的新的评估指标

1.邻域模型

目标:预测用户u对项目i的评级,并通过相似性识别出u对i相似的项目的评分

2.潜在因子模型

目标:更全面的揭示潜在特征,从而解释观察到的评级。文章主要关注SVD(待学)的模型。
已有模型的问题:

最近邻:最近邻方法根据用户已经打分过的物品或者用户间相似性,计算和这些物品最相似的物品,相当于一个局部最优解,没有考虑全局性,毕竟一个用户关注的物品是有限的。
因子分解:可以得到全局表示,但是可解释性不佳


方法的改进

已有最近邻模型

1.根据用户和物品的打分矩阵或者相关数据,计算两两之间的相似度s(i,j)s(i, j)s(i,j)
2.对于稀疏矩阵需要对数据规模进行置信度加权,常用的加权方法sij=nijnij+λPijs_{ij}=\frac{n_{ij}}{n_{ij}+\lambda}P_{ij}sij=nij+λnijPij
3.用户对物品打分公式为rui=bui+∑j∈Si;uksij(ruj−buj)∑j∈Si;uk,其中bui为基准推荐模型,计算公式bui=μ+bu+bi,r_{ui}=b_{ui}+\frac{\sum_{j\in S_{i;u}^k s_{ij}(r_{uj}-b_{uj})}}{\sum_{j\in S_{i;u}^k}},其中b_{ui}为基准推荐模型,计算公式b_{ui}=\mu+b_u+b_i,rui=bui+jSi;ukjSi;uksij(rujbuj)buibui=μ+bu+bi即全局偏置+用户偏置+物品偏置;Si;uk表示用户关注的物品集合中和物品i最相似的k个即全局偏置+用户偏置+物品偏置;S_{i;u}^k表示用户关注的物品集合中和物品i最相似的k个++Si;ukik

已有因子分解模型
min∑rui≠0(rui−μ−bu−bi−puTqi)2+λ(∣∣pu∣∣2+qi∣∣2+bu2+bi2)min\sum_{r_{ui\neq 0}}(r_{ui}-\mu-b_u-b_i-p_u^Tq_i)^2+\lambda(||p_u||^2+\\q_i||^2+b_u^2+b_i^2)minrui̸=0(ruiμbubipuTqi)2+λ(pu2+qi2+bu2+bi2)


新的邻域模型

将SVD++和最近邻模型加入隐式模型并对邻域个数归一化相加。
相当于三层模型的累加:基准模型,因子分解模型,最近邻模型

结论

缺点:对隐式数据集建模比较简单,对隐式数据的处理不充分。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值