大数据之-Hadoop_推荐系统框架图---大数据之hadoop工作笔记0015

添柴程序猿

于 2021-03-04 15:47:54 发布

阅读量593

点赞数 1

CC 4.0 BY-SA版权

分类专栏：集群&算法&量子计算

本文为博主原创文章，未经博主添柴程序猿允许不得转载违者追究法律责任。

本文链接：https://blog.youkuaiyun.com/lidew521/article/details/114367051

集群&算法&量子计算专栏收录该内容

259 篇文章 ¥9.90 ¥99.90

订阅专栏

超级会员免费看

本文介绍了基于Hadoop的大数据推荐系统架构。用户在购买商品后，其行为日志被Tomcat收集并通过Flume存储到HDFS。YARN调度Spark Streaming进行实时计算，找出相似商品，结果存储在数据库或文件中。后端JavaEE系统从分析结果中获取数据，推荐给用户。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

然后我们来看一下推荐系统的架构是什么样子的,

比如你购买完淘宝的商品以后他就会自动的给你推荐类似的产品.

从上面可以看到,比如我要买海狗人参丸,那么当我们点击这个商品,会给nginx发送请求,然后

这个请求的记录,会被tomcat等收集,这里也就是收集用户的行为日志.

收集起来这个用户的购买行为日志以后,然后把这个日志数据,属于稳健日志,然后

通过flume进行日志收集,收集以后存到hdfs文件中存储,或者存到hbase中,但最终都是存到hdfs中,

然后再通过yarn进行调用,计算资源,比如利用spark streaming去进行实时计算,获取该用户的,历史商品访问数据,同时获取,系统中的

其他商品数据,结合用户本次购买的商品数据,把类似商品找到.

找到以后:

了解本专栏

超级会员免费看

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

添柴程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。