对于相同喜好的用户,电商高手用Spark MLlib代码如何操作?

本文介绍了协同过滤这一成熟推荐算法的原理及应用。基于用户和基于物品的两种主流方法被详细探讨,同时提及了该算法在面对新用户时可能遇到的问题。
日前,小编接触了一个概念——协同过滤。相信很朋友也是第一次听说,上网在某度搜一下,结果发现这个算法居然是很成熟的。


“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。”


通过学习,小编了解到:在协同过滤中,有两种主流方法:基于用户的协同过滤,和基于物品的协同过滤。


基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。

基于物品的 CF 的原理和基于用户的 CF 类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。


通过海量数据找到兴趣相同的用户确实是比较容易实现的!但这都是对于老用户而言的。


问题是对于新用户如何通过协同过滤算法解决呢?算法用Spark MLlib代码如何操作呢?


中科院计算所培训中心将于11月6日晚8点,举办《机器学习实战:揭开利用Spark MLlib进行个性推荐的奥秘!》欢迎报名学习!(具体详情请到官网了解)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值