hadoop高可用（HA）模式搭建

原创于 2025-08-14 17:58:09 发布 · 835 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop #大数据 #分布式

大数据同时被 2 个专栏收录

277 篇文章

订阅专栏

Hadoop

52 篇文章

订阅专栏

Hadoop 高可用（HA）模式详解

Hadoop 高可用（High Availability, HA）模式是为了解决 NameNode 单点故障（SPOF, Single Point of Failure） 问题而设计的架构。在传统 Hadoop 架构中，如果 NameNode 宕机，整个 HDFS 集群将不可用，直到管理员手动恢复。HA 模式通过 主备 NameNode + 共享存储（JournalNode） 的方式实现自动故障转移（Failover），提高集群的可靠性。

1. Hadoop HA 的核心组件

在 HA 模式下，Hadoop 引入了以下关键组件：

组件	作用
Active NameNode	当前处理客户端请求的主 NameNode，负责管理 HDFS 元数据。
Standby NameNode	热备节点，实时同步 Active NameNode 的元数据，随时准备接管。
JournalNode (JN)	存储 NameNode 的编辑日志（edits），确保主备 NameNode 数据一致。
ZKFC (ZK Failover Controller)	监控 NameNode 状态，触发主备切换（基于 ZooKeeper）。
ZooKeeper (ZK)	提供分布式协调服务，用于选举 Active NameNode 和存储集群状态。

2. Hadoop HA 的工作原理

(1) 元数据同步机制

Active NameNode 将所有元数据更改（如创建、删除文件）写入 edits 日志，并同步到 JournalNode 集群（通常由 3 或 5 个节点组成，基于 Paxos 协议保证一致性）。
Standby NameNode 从 JournalNode 读取 edits 日志，并定期合并到自己的 fsimage（文件系统镜像），保持与 Active NameNode 的元数据一致。

(2) 故障检测与自动切换（Failover）

ZKFC 监控 NameNode 健康状态：
- 每个 NameNode 都有一个 ZKFC 进程，定期向 ZooKeeper 发送心跳。
- 如果 Active NameNode 宕机或失去响应，ZKFC 会检测到并触发故障转移。
ZooKeeper 选举新的 Active NameNode：
- ZKFC 通过 ZooKeeper 的临时节点（Ephemeral Node）机制，确保只有一个 NameNode 处于 Active 状态。
- 当原 Active NameNode 失效时，Standby NameNode 会获取 ZooKeeper 的锁，并提升为新的 Active NameNode。
客户端透明切换：
- 客户端通过 HDFS 的抽象命名空间（如 hdfs://mycluster） 访问集群，无需关心具体是哪个 NameNode 在服务。

3. Hadoop HA 的配置要点

(1) 关键配置参数（`hdfs-site.xml`）

<!-- 启用 HDFS HA -->
<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value> <!-- 集群逻辑名称 -->
</property>

<!-- 定义 NameNode ID -->
<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2</value> <!-- 两个 NameNode 的 ID -->
</property>

<!-- 配置 RPC 地址 -->
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>namenode1:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>namenode2:8020</value>
</property>

<!-- 配置 JournalNode 地址 -->
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://journalnode1:8485;journalnode2:8485;journalnode3:8485/mycluster</value>
</property>

<!-- 启用自动故障转移 -->
<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>true</value>
</property>

<!-- 指定 ZKFC 使用的 ZooKeeper 集群 -->
<property>
  <name>ha.zookeeper.quorum</name>
  <value>zk1:2181,zk2:2181,zk3:2181</value>
</property>

(2) ZooKeeper 配置

ZooKeeper 集群通常由 3 或 5 个节点 组成（避免脑裂问题）。
ZKFC 依赖 ZooKeeper 的临时节点（Ephemeral Node）实现主备选举。

4. Hadoop HA 的两种故障转移方式

(1) 手动故障转移

管理员通过命令手动切换 Active/Standby 状态：

hdfs haadmin -transitionToActive <namenode_id> --forcemanual

(2) 自动故障转移（推荐）

依赖 ZKFC + ZooKeeper 实现自动检测和切换。
配置 dfs.ha.automatic-failover.enabled=true 后，集群会自动处理 NameNode 故障。

5. HA 模式下的数据一致性保证

JournalNode 的 Quorum 机制：至少需要 N/2 + 1 个 JournalNode 存活（如 3 个 JN 允许 1 个失败）。
Fencing（隔离）机制：防止脑裂（Split-Brain），确保只有一个 Active NameNode。常见方法：
- SSH Fencing：通过 SSH 杀死原 Active NameNode 进程。
- Shell 脚本：自定义脚本隔离旧 Active 节点。

6. HA 模式的优缺点

优点

高可用性：NameNode 故障时自动切换，减少停机时间。
透明切换：客户端无需修改配置。
数据一致性：通过 JournalNode 保证主备元数据同步。

缺点

部署复杂度高：需要额外维护 JournalNode 和 ZooKeeper 集群。
资源消耗增加：需要至少两个 NameNode 和多个 JournalNode。

7. 常见问题

Q1: Standby NameNode 会处理客户端请求吗？

不会。Standby NameNode 仅同步元数据，不响应客户端请求（除非切换为 Active）。

Q2: HA 模式下 Secondary NameNode 还需要吗？

不需要。Standby NameNode 已经替代了 Secondary NameNode 的合并 fsimage 和 edits 的功能。

Q3: 如何验证 HA 是否正常工作？

手动杀死 Active NameNode，观察 Standby 是否自动接管：
```
kill -9 <Active_NameNode_PID>
```

查看 ZooKeeper 的选举状态：

zkCli.sh -server zk1:2181
get /hadoop-ha/mycluster/ActiveStandbyElectorLock

总结

Hadoop HA 模式通过 主备 NameNode + JournalNode + ZooKeeper 的架构，解决了 NameNode 单点故障问题，是生产环境部署的必备选项。正确配置后，集群可以做到 秒级故障切换，大幅提升可靠性。