Hadoop的容错性

本文探讨了Hadoop的容错性,主要集中在MapReduce和HDFS两部分。MapReduce的容错包括处理任务异常、TaskTracker失败和JobTracker失败的情况。HDFS的容错由NameNode和DataNode的备份策略保证,如SecondNameNode的角色和NameNode的Zookeeper备份方案,以及DataNode的数据块冗余备份策略防止数据丢失。

要谈及Hadoop的容错性,就不得不先从Hadoop的组成说起。Hadoop的1版本可以理解为是由MapReduce离线处理框架和HDFS文件系统组成。而Hadoop的2版本在1的基础上,增加了YARN资源管理系统。因为我自己接触2的时间不长,今天就针对前两个来谈Hadoop的容错性。

一、MapReduce的容错性:

1, map或reduce运行时因代码原因而抛出的异常。在这种情况下,子进程JVM会在进程退出前向TaskTracker父进程发送错误报告。在日志中记录该错误。

2, TaskTracker失败:有TaskTracker运行缓慢或崩溃而导致无法向JobTracker发送心跳,JobTracker会将该TaskTracker从任务调度池中移除,并重新调度该任务。

3, JobTracker失败:这种失败发生的概率很小;但一旦发生导致的后果最为严重,因此通过Zookeeper协调机制来降低这种问题发生的概率。

 

总结:

JobTracker 对应于 NameNode

TaskTracker 对应于 DataNode

NameNode和DataNode是只对数据存放而言的

JobTracker和TaskTracker是对应于MapReduce执行而言

二、HDFS的容错性

首先简

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值