
电影推荐系统
黄山路443号
这个作者很懒,什么都没留下…
展开
-
大数据项目之电影推荐系统(三)统计推荐模块
3. 统计推荐模块要点:从MongoDB中读取数据保存为DataFrame要统计的信息包括:历史热门,评分数据最多select mid,count(*) from rateDF group by mid近期热门统计,统计评分个数select mid from rateDF group by yearmonth,mid order by yearmonth, mid...原创 2020-03-12 17:35:38 · 4965 阅读 · 1 评论 -
大数据项目之电影推荐系统(二)数据加载模块
2. 数据加载模块这一部分将数据文件存入Mongo和ElasticSearch中要点:建立电影数据,评分数据,标签数据的样例类建立数据库连接属性的样例类初始化SparkConf,SparkSession读取数据文件,保存为RDDRDD=>map(根据分隔符分割)=>建立样例类实例=>通过样例类创建DataFrame数据存入MongoDB将每一部电影与用户打的标...原创 2020-03-12 17:10:19 · 3322 阅读 · 0 评论 -
大数据项目之电影推荐系统(一)项目介绍与环境配置
电影推荐系统一、项目介绍项目以某科技公司电影网站真实业务数据架构为基础,基于阿里云ESC服务器,构建了包含了离线推荐与实时推荐体系的电影推荐系统,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务实现。二、项目实现开发环境:阿里云服务器CentOS6,本地Window 10使用工具:IDea,Spark 2...原创 2020-03-12 16:54:47 · 5900 阅读 · 0 评论 -
Elasticsearch无法写入数据问题的解决【EsHadoopNoNodesLeftException: Connection error (check network and/or proxy】
问题:spark项目中,向Elasticsearch中创建索引成功,但无法写入数据报错:org.elasticsearch.hadoop.rest.EsHadoopNoNodesLeftException: Connection error (check network and/or proxy settings)- all nodes failed解决办法:代码中初始化SparkConf...原创 2020-03-12 15:01:58 · 3898 阅读 · 1 评论