Hadoop2.5 HA搭建说明

最新推荐文章于 2024-08-25 12:13:51 发布

原创最新推荐文章于 2024-08-25 12:13:51 发布 · 455 阅读

0 ·

CC 4.0 BY-SA版权

Hadoop 同时被 2 个专栏收录

63 篇文章

订阅专栏

Zookeeper

21 篇文章

订阅专栏

本文详细介绍了一种Hadoop高可用集群的搭建过程，包括配置核心站点文件、HDFS站点文件，设置Zookeeper集群，配置Hadoop slaves文件，启动Zookeeper和JournalNode服务等关键步骤。

四台机器：hadoop1，hadoop2，hadoop3，hadoop4

	NN	DN	ZK	ZKFC	JN	RM	NM（任务管理）
Hadoop1	Y		Y	Y
Hadoop2	Y	Y	Y	Y	Y	Y	Y
Hadoop3		Y	Y		Y		Y
Hadoop4		Y			Y		Y

1. core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://bjsxt</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop</value>

</property>

</configuration>

2. hdfs-site.xml

<name>dfs.nameservices</name>

<value>bjsxt</value>

</property>

<name>dfs.ha.namenodes.bjsxt</name>

</property>

<name>dfs.namenode.rpc-address.bjsxt.nn1</name>

<value>hadoop1:8020</value>

</property>

<name>dfs.namenode.rpc-address.bjsxt.nn2</name>

<value>hadoop2:8020</value>

</property>

<name>dfs.namenode.http-address.bjsxt.nn1</name>

<value>hadoop1:50070</value>

</property>

<name>dfs.namenode.http-address.bjsxt.nn2</name>

<value>hadoop2:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop2:8485;hadoop3:8485;hadoop4:8485/bjsxt</value>

</property>

<name>dfs.client.failover.proxy.provider.bjsxt</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/opt/hadoop/data</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

</configuration>

3. 准备zookeeper

a) 三台zookeeper：hadoop1，hadoop2，hadoop3
b) 编辑zoo.cfg配置文件
i. 修改dataDir=/opt/zookeeper
ii. server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
c) 在dataDir目录中创建一个myid的文件，文件内容为1，2，3

4. 配置hadoop中的slaves

5. 启动三个zookeeper：./zkServer.sh start

6. 启动三个JournalNode：./hadoop-daemon.sh start journalnode

7. 在其中一个namenode上格式化：hdfs namenode -format

8. 把刚刚格式化之后的元数据拷贝到另外一个namenode上
a) 启动刚刚格式化的namenode :hadoop-daemone.sh start namenode
b) 在没有格式化的namenode上执行：hdfs namenode -bootstrapStandby
c) 启动第二个namenode

9. 在其中一个namenode上初始化zkfc：hdfs zkfc -formatZK

10. 停止上面节点：stop-dfs.sh

11. 全面启动：start-dfs.sh