本文暂时分为三部分:
(一)基于Spark MLlib平台和基于模型的协同过滤算法的电影推荐系统(一)
→ 协同过滤算法概述&&基于模型的协同过滤的算法思想
(二)基于Spark MLlib平台和基于模型的协同过滤算法的电影推荐系统(二)
→ 代码实现
(三)基于Spark MLlib平台和基于模型的协同过滤算法的电影推荐系统(二)
→作业里的拓展
本文基于Spark MLlib平台实现一个向用户推荐电影的简单应用。其中,主要包括三部分内容:
一、协同过滤算法概述二、基于模型的协同过滤应用---电影推荐
三、实时推荐架构分析
关于协同过滤的一个最经典的例子就是看电影,有时候不知道哪一部电影是我们喜欢的或者评分比较高的,那么通常的做法就是问问周围的朋友,看看最近有什么好的电影推荐。在问的时候,都习惯于问跟自己口味差不多的朋友,这也是协同过滤的核心思想:在海量数据中挖掘出小部分与你品味类似的用户,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的东西组织成一个排序的目录推荐给你。
所以就有如下两个核心问题: