《Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model》经典论文阅读

文章主要研究点

  • 本文的对潜在因子模型和邻域模型进行了平滑合并,目的:建立更精确的组合模型,利用用户显式和隐式反馈进一步提高了精度
  • 在top-K推荐任务中的新的评估指标

1.邻域模型

目标:预测用户u对项目i的评级,并通过相似性识别出u对i相似的项目的评分

2.潜在因子模型

目标:更全面的揭示潜在特征,从而解释观察到的评级。文章主要关注SVD(待学)的模型。
已有模型的问题:

最近邻:最近邻方法根据用户已经打分过的物品或者用户间相似性,计算和这些物品最相似的物品,相当于一个局部最优解,没有考虑全局性,毕竟一个用户关注的物品是有限的。
因子分解:可以得到全局表示,但是可解释性不佳


方法的改进

已有最近邻模型

1.根据用户和物品的打分矩阵或者相关数据,计算两两之间的相似度 s ( i , j ) s(i, j) s(i,j)
2.对于稀疏矩阵需要对数据规模进行置信度加权,常用的加权方法 s i j = n i j n i j + λ P i j s_{ij}=\frac{n_{ij}}{n_{ij}+\lambda}P_{ij} sij=nij+λnijPij
3.用户对物品打分公式为 r u i = b u i + ∑ j ∈ S i ; u k s i j ( r u j − b u j ) ∑ j ∈ S i ; u k , 其 中 b u i 为 基 准 推 荐 模 型 , 计 算 公 式 b u i = μ + b u + b i , r_{ui}=b_{ui}+\frac{\sum_{j\in S_{i;u}^k s_{ij}(r_{uj}-b_{uj})}}{\sum_{j\in S_{i;u}^k}},其中b_{ui}为基准推荐模型,计算公式b_{ui}=\mu+b_u+b_i, rui=bui+jSi;ukjSi;uksij(rujbuj)buibui=μ+bu+bi 即 全 局 偏 置 + 用 户 偏 置 + 物 品 偏 置 ; S i ; u k 表 示 用 户 关 注 的 物 品 集 合 中 和 物 品 i 最 相 似 的 k 个 即全局偏置+用户偏置+物品偏置;S_{i;u}^k表示用户关注的物品集合中和物品i最相似的k个 ++Si;ukik

已有因子分解模型
m i n ∑ r u i ≠ 0 ( r u i − μ − b u − b i − p u T q i ) 2 + λ ( ∣ ∣ p u ∣ ∣ 2 + q i ∣ ∣ 2 + b u 2 + b i 2 ) min\sum_{r_{ui\neq 0}}(r_{ui}-\mu-b_u-b_i-p_u^Tq_i)^2+\lambda(||p_u||^2+\\q_i||^2+b_u^2+b_i^2) minrui̸=0(ruiμbubipuTqi)2+λ(pu2+qi2+bu2+bi2)


新的邻域模型

将SVD++和最近邻模型加入隐式模型并对邻域个数归一化相加。
相当于三层模型的累加:基准模型,因子分解模型,最近邻模型

结论

缺点:对隐式数据集建模比较简单,对隐式数据的处理不充分。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值