Storm的容错性(可靠性)

本文详细介绍了Storm集群中各类故障的处理方式,包括Worker、节点、Nimbus和Supervisor守护进程挂掉的情况,以及Nimbus的高可用性设计。通过重新启动和任务重新分配等机制,确保了系统的稳定运行。

1.Worker挂掉

当worker挂掉,supervisor将会重新启动它,如果supervisor启动连续失败并且无法对Nimbus进行心跳,Nimbus将会在其他机器上重新安排worker

2.节点挂掉

如果节点机器挂掉,分配给该机器的任务将超时,Nimbus会将这些任务重新分配给其他机器

3.Nimbus或者Supervisor守护进程挂掉

Nimbus和Supervisor守护进程设计为快速失败(遇到任何意外情况时进程自毁)和无状态(所有状态都保存在Zookeeper或磁盘上),因此,如果Nimbus或Supervisor守护进程死亡,它们会重新启动,就像没有发生任何事情一样

Nimbus或者Supervisor守护进程的死亡不会影响worker

4.Nimbus是单点故障吗?

Nimbus挂掉,worker将仍然会运行,worker挂掉,Nimbus会重新启动worker,是可以做HA高可用的

Nimbus是有备用的,一个处于活跃状态,一个处于等待状态

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值