评分预测问题计算方法

摘要:

内容:

1.平均值

  1.1 全局平均值

  1.2 用户评分平均值

  1.3 物品评分平均值

  1.4 用户分类对物品分类的平均值

  分类方法:

    1.4.1 平均值分类

    1.4.2 活跃度/流行度分类

2.基于邻域的方法

  2.1 基于用户的协同过滤

    

   

 

  2.2 基于物品的协同过滤

  相似度计算方法选择:

    基于共现矩阵的相似度

    余弦相似度    

3.隐语义模型与矩阵分解模型

  3.1 ALS 矩阵分解模型  

4.加入时间因素

  1.基于邻域的模型融合时间信息

5.模型融合

  1.级联方式

  2.加权融合

我的代码:

  1.python部分:

    
  2.spark部分:

    https://github.com/Tongzhenguo/my_scala_code/blob/master/src/main/scala/person/tzg/scala/ItemBaseCF.scala

数据集来源:

  http://www.pkbigdata.com/common/cmpt/猜你喜欢_竞赛信息.html

转载于:https://www.cnblogs.com/arachis/p/rating_predict.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值