基于Hadoop集群实现数据处理及可视化展示

EEEurekaaa！

已于 2022-12-15 11:08:03 修改

阅读量1.8k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： Hadoop集群搭建及实例应用文章标签： hadoop 大数据分布式 java hdfs

于 2022-12-13 23:05:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_52940881/article/details/128309299

Hadoop集群搭建及实例应用专栏收录该内容

15 篇文章

订阅专栏

本文介绍了一个基于疫情数据的大数据处理和分析流程。从爬虫数据抓取开始，经过Hadoop集群处理，再到SpringBoot+Echart的数据展示，最终实现疫情数据的可视化分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在集群搭建完毕之后，后续工作实现逻辑是：

1.部署爬虫到虚拟机（先在虚拟机中配置python环境）

2.flume负载均衡监控爬虫输出路径并将日志上传到hdfs

3.编写mapreduce排序，去空值，规范数据

4.将mapreduce的结果通过sqoop导出到本地MySQL

5.基于springboot+echart可视化展示结果

6.上传springboot项目到服务器，在线展示

7.azkaban调度执行以上内容

后续会将文章写出来，我这个项目的主题是疫情（虽然疫情快结束了，主要是分享思路，祝大家身体健康），数据来源于百度疫情（世界和我国各城市相关疫情数据）和一个私人的疫情网站（我国近十天的历史疫情数据），页面比较简陋，因为本人前端的功底比较薄弱。欢迎留言提供建议！

成果展示：

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

EEEurekaaa！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。