storm - 使用过程中的一点思考

最新推荐文章于 2025-12-03 17:29:49 发布

转载最新推荐文章于 2025-12-03 17:29:49 发布 · 105 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/jiyuqi/p/4665597.html

文章标签：

#大数据 #ui #数据库

本文深入探讨了Storm数据处理框架的核心理念与应用实践，强调其作为一种流式数据处理范式的优势，尤其在即时处理场景下相比Hadoop的优越性。文章详细介绍了Storm支持的多语言特性、类依赖打包机制、多topo并行处理能力以及与Zookeeper等工具的配合使用，为读者提供了全面的Storm使用指南。

引子

这几天为了优化原有的数据处理框架，比较系统的学习了storm的一些内容，整理一下心得

1. storm提供的是一种数据处理思想，它不提供具体的解决方案

　　storm的核心是topo的定义，而topo承载着所有的业务逻辑，我们基于storm的topo的组织方案，来编排私有的业务实现逻辑。

　　storm的业务抽象是最基本的信息流式处理范式。

2. storm支持多种语言

　　storm提供的处理框架支持多种语言，java只是其中一种，我们可以使用不同的语言实现topo

3. storm会将依赖的class打入同一个类

　　这对初学者可能很奇怪，但这是storm为了分布式部署所做的妥协，如果jar包本身带有运行期所需要的所有东西，那storm本身就可以只作为一个运行框架而存在，而jar包在cluster之间的分发也会变得容易许多。

4. storm可以支持多个topo

　　上面一再说了，storm本身只是一种数据的处理框架，业务逻辑的核心是topo，我们可以向storm集群中提交多个topo来充分使用storm的集群式处理能力。也因为配置是对topo生效的，因此也可以定义topo的处理能力。

5. 与hadoop相比较，storm更擅长即时处理

　　storm不会有hadoop复杂和冗长的预处理过程，分布式的storm和分布式的hadoop是一对好搭档，他们可以共同构成一套大数据处理框架。

6. storm的topo间通信基本是不可行的

　　topo在storm中独立运行，互不干扰的，在代码层面进行topo的直接通信是不可行的（至少我没有找到），只能通过storm ui和有限的api来进行监控。

　　如果实在有通信需求，可以考虑使用zookeeper或者数据库作为通信的中介，有topo与中介通信实现间接的交流。

转载于:https://www.cnblogs.com/jiyuqi/p/4665597.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。