大数据学习笔记之strom----实时流处理引擎

Apache Storm是一款开源的分布式实时计算系统,能够处理大规模的数据流并确保数据得到实时处理。Storm支持水平扩展、容错机制并且可以在多种编程语言中开发应用。其采用Master-Slave架构,由Nimbus节点负责任务调度,而Supervisor节点则执行具体的计算任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述

Apache Strom是开源分布式实时计算系统,为Apache的顶级项目,同Hadoop一样Strom也可以处理大批量数据,然而Strom在保证高可靠的前提下还可以让处理进行得更加实时,也就是说,所有得信息都会被处理。Strom同样还具备容错和分布式计算这些特性,这就让Strom可以扩展到不同得机器上进行大批量得数据处理。

Strom可水平扩展,支持容错,保证所有数据被处理,易于安装维护,可以使用各种程序设计语言开发,具备高性能,单节点每秒可以处理上百万记录。

Strom体系结构

Strom是典型的Master-Slave架构,Strom集群中有两种节点,一种是控制节点(Nimbus节点),另一种是工作节点(supervisor节点)。Topology任务提交给Nimbus节点,Nimbus分配给其他Supervisors节点进行处理。Nimbus节点首先将提交的Topology进行分片,分成一个个的Task,并将Task和Supervisors相关的信息提交到Zookeeper集群上,Supervisor会去Zookeeper集群傻瓜认领自己的Task,通知自己的worker进程进行Task的处理。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值