大数据之-Hadoop_推荐系统框架图---大数据之hadoop工作笔记0015

本文介绍了基于Hadoop的大数据推荐系统架构。用户在购买商品后,其行为日志被Tomcat收集并通过Flume存储到HDFS。YARN调度Spark Streaming进行实时计算,找出相似商品,结果存储在数据库或文件中。后端JavaEE系统从分析结果中获取数据,推荐给用户。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

然后我们来看一下推荐系统的架构是什么样子的,

比如你购买完淘宝的商品以后他就会自动的给你推荐类似的产品.

 

从上面可以看到,比如我要买海狗人参丸,那么当我们点击这个商品,会给nginx发送请求,然后

这个请求的记录,会被tomcat等收集,这里也就是收集用户的行为日志.

 

收集起来这个用户的购买行为日志以后,然后把这个日志数据,属于稳健日志,然后

通过flume进行日志收集,收集以后存到hdfs文件中存储,或者存到hbase中,但最终都是存到hdfs中,

然后再通过yarn进行调用,计算资源,比如利用spark streaming去进行实时计算,获取该用户的,历史商品访问数据,同时获取,系统中的

其他商品数据,结合用户本次购买的商品数据,把类似商品找到.

 

找到以后:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值