hadoop的HA
图解
失败迁移
当active状态的NameNode由于不可预知的原因突然挂掉时,ZK收不到心跳反馈,超过配置的最大等待时间后,将原来standby状态的NameNode置为Active状态,这时由新的Active的NameNode来想JurnalNode中写入日志文件,并响应客户端的请求
hadoop的联盟(Federation)
图解
负载均衡
每个NameNode 默认由1000M的缓存,多个NameNode可以加大这个缓存,从而提高查询速度
启动阶段
HDFS的启动有四个阶段
- 加载fsimage (nameNode完成)
- 加载edits (nameNode完成)
- saving checkpoint (保存检查点,合并日志–有seconderyNameNode 来完成)
- safemode 安全模式阶段,是hadoop的一种保护机制,DataNode会向NameNode上传它们数据块的列表,让 NameNode得到块的位置信息,并对每个文件对应的数据块副本进行统计。当最小副本条件满足时,即一定比例的数据块都达到最小副本数,系统就会退出安全模式,而这需要一定的延迟时间。当最小副本条件未达到要求时,就会对副本数不足的数据块安排DataNode进行复制,直至达到最小副本数。而在安全模式下,系统会处于只读状态,NameNode不会处理任何块的复制和删除命令