1,概述
公司是做社交app的,最近做了一个话题推荐的小项目。在博客上分享一下
采用的框架主要是Hadoop+Azkaban+Sqoop+Spark
做话题的推荐,主要分了三个类
- 基于用户对于话题的偏好值的推荐,这里需要根据用户的行为,例如收藏,分享,评论,点赞等,再根据运营的逻辑,来权衡各个行为的权重,最后得到用户对于这个话题的偏好值
- 基于话题关于话题类别的推荐,这里需要在话题创建的时候就给话题打上相应的标签,例如话题分成大类,又分小类,比如漫画类型,再分三个小类,标签为categoryId=1的是国产漫画,2的是日漫,3的是欧美漫画。影视电影 类似
- 基于文本类容的推荐。在话题创建的时候有话题的题目以及对于话题的文本描述。通过对于话题相关内容进行分词,来获取这个话题的特征。然后计算文本间的相似度,再进行推荐