日前,小编接触了一个概念——协同过滤。相信很朋友也是第一次听说,上网在某度搜一下,结果发现这个算法居然是很成熟的。
“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。”
通过学习,小编了解到:在协同过滤中,有两种主流方法:基于用户的协同过滤,和基于物品的协同过滤。

基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。

基于物品的 CF 的原理和基于用户的 CF 类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。
通过海量数据找到兴趣相同的用户确实是比较容易实现的!但这都是对于老用户而言的。
问题是对于新用户如何通过协同过滤算法解决呢?算法用Spark MLlib代码如何操作呢?
中科院计算所培训中心将于11月6日晚8点,举办《机器学习实战:揭开利用Spark MLlib进行个性推荐的奥秘!》欢迎报名学习!(具体详情请到官网了解)
“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。”
通过学习,小编了解到:在协同过滤中,有两种主流方法:基于用户的协同过滤,和基于物品的协同过滤。
基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。
基于物品的 CF 的原理和基于用户的 CF 类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。
通过海量数据找到兴趣相同的用户确实是比较容易实现的!但这都是对于老用户而言的。
问题是对于新用户如何通过协同过滤算法解决呢?算法用Spark MLlib代码如何操作呢?
中科院计算所培训中心将于11月6日晚8点,举办《机器学习实战:揭开利用Spark MLlib进行个性推荐的奥秘!》欢迎报名学习!(具体详情请到官网了解)