简介
所谓HA,即高可用(7*24小时不中断服务),实现高可用最关键的是消除单点故障
hadoop-HA严格来说应该分成各个组件的HA机制——HDFS的HA、YARN的HA
HDFS的HA机制架构
HDFS的HA机制详解
Hadoop2增加了对HDFS的HA支持,配置了一对活动-备用(active-standy)namenode,当活动namenode失效,备用namenode接管它的任务并开始服务于客户端的请求,不会有明显的中断。
为了能够实时同步Active和Standby两个NameNode的元数据信息(实际上edits日志),需提供一个共享存储系统,可以是NFS、QJM(Quorum Journal Manager)群体日志管理器,Active Namenode将数据写入共享存储系统,而Standby监听该系统,一旦发现有新数据写入,则读取这些数据,并加载到自己内存中,以保证自己内存状态与Active NameNode保持基本一致。如此