Storm入门与安装配置

Apache Storm是一个开源的实时计算系统,提供可靠的数据处理能力。本文介绍了Storm的用途,如实时分析、机器学习等,并对比了实时计算与批处理的区别。详细讲述了Storm的体系架构,以及如何在本地和集群模式下安装配置Zookeeper和Storm,包括环境变量配置、Zookeeper集群的搭建和验证数据同步等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、官网:storm.apache.org,twitter开源。

2、为什么使用Storm?

Stom是一个免费和开源分布式实时计算系统。 Storm可以实时可靠地处理无限流的数据,可使用任何编程语言
Storm有许多应用,如网上实时分析,机器学习,连续计算,分布式RPC、ETL等等。 Storm运行速度很快:每个节点每秒钟可处理上百万个Tuple。 它是可伸缩的,容错的,保证你的数据将被处理,也很很容易设置和操作。

Stormke可以整合队列和数据库的技术。 Storm topology可以以任意复杂的方式消费Stream数据,但在数据计算的每个阶段需要重新划分Stream。 

3、什么是实时计算?

4、批计算VS实时计算。

批计算:批量获取数据,批量传输数据,周期性计算

        例子:Sqoop从关系型数据库中抽取数导入到Hive或Hbase并最终保存在HDFS上,使用MapReduce或Hive进行处理。

实时计算:数据源源不断产生,使用流式处理系统计算。

        例子:Flume实时数据采集或直接读取数据库日志,然后缓存Kafka中,并使用Storm计算,将最终结果保存在Hbase或Postgre数据库中。

 

5、MapReduce VS Storm

 

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值