ha高可用搭建步骤

最新推荐文章于 2025-01-06 16:10:11 发布

HUBU_小马哥

最新推荐文章于 2025-01-06 16:10:11 发布

阅读量286

点赞数

CC 4.0 BY-SA版权

分类专栏：搭建步骤总结文章标签： ha高可用搭建

本文链接：https://blog.youkuaiyun.com/qq_42526661/article/details/82632397

搭建步骤总结专栏收录该内容

3 篇文章

订阅专栏

本文档详细介绍了如何搭建Hadoop HA集群，包括集群规划、配置步骤、集群启动和测试。集群包含2个NameNode、4个DataNode、3个JournalNode和2个ResourceManager。配置涉及core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml等文件，以及Zookeeper集群的设置。最后，通过测试确保了NameNode和ResourceManager的高可用性。

ps:mx为用户名

ha的搭建：
   集群的规划：
   hdfs:
   namenode(2个) datanode（4个） journalnode(3台) zkfc(2个)
   mapreduce
   yarn：
   resourcemanager(2个) nodemanager（4个）
   zookeeper:
   3台 QuorumPeerMain

hadoop05 hadoop06 hadoop07 hadoop08
hdfs   namenode namenode
datanode datanode datanode    datanode
journalnode    journalnode journalnode
zkfc zkfc
yarn resourcemanager resourcemanager
nodemanager nodemanager nodemanager nodemanager
zk： QuorumPeerMain       QuorumPeerMain QuorumPeerMain

集群搭建步骤：
   集群准备：
   1）ip 主机名
   2)hosts
   3)关闭防火墙 selinux
   4）修改系统的启动级别 3
   5）添加普通用户的selders权限
   6）进行免密码登录
   7）安装jdk
   8）进行时间同步
搭建集群：
1.上传 hadoop-2.7.6.tar.gz
--------------------------------------------------------
2.解压
   tar -xvzf hadoop-2.7.6.tar.gz -C /home/mx/apps/
--------------------------------------------------------
3.配置环境变量----之前创建过软链，不需要重新配置
vi /etc/profile

export HADOOP_HOME=/home/mx/apps/hadoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile
验证：
hadoop version
-----------------------------------------------------

4.修改hadoop的配置文件
   cd /home/mx/apps/hadoop/etc/hadoop
   在此目录下修改配置文件
   vi ......
-----------------------------------------------------
   1）hadoop-env.sh 导入jdk的环境变量
-----------------------------------------------------
# The java implementation to use.
export JAVA_HOME=/home/mx/apps/jdk
-----------------------------------------------------
   2）core-site.xml
-----------------------------------------------------

<property>
   <name>fs.defaultFS</name>
   <value>hdfs://bd1805/</value>
</property>

<property>
   <name>hadoop.tmp.dir</name>
   <value>/home/mx/data/hadoopdata/</value>
</property>

<property>
   <name>ha.zookeeper.quorum</name>
   <value>hadoop05:2181,hadoop06:2181,hadoop07:2181</value>
</property>
----------------------------------
   3)hdfs-site.xml
----------------------------------

<property>
   <name>dfs.replication</name>
   <value>3</value>
</property>

<property>
   <name>dfs.nameservices</name>
   <value>bd1805</value>
</property>

<property>
   <name>dfs.ha.namenodes.bd1805</name>
   <value>nn1,nn2</value>
</property>

<property>
   <name>dfs.namenode.rpc-address.bd1805.nn1</name>
   <value>hadoop05:9000</value>
</property>

<property>
   <name>dfs.namenode.http-address.bd1805.nn1</name>
   <value>hadoop05:50070</value>
</property>

<property>
   <name>dfs.namenode.rpc-address.bd1805.nn2</name>
   <value>hadoop06:9000</value>
</property>

<property>
   <name>dfs.namenode.http-address.bd1805.nn2</name>
   <value>hadoop06:50070</value>
</property>

<property>
   <name>dfs.namenode.shared.edits.dir</name>
   <value>qjournal://hadoop05:8485;hadoop06:8485;hadoop07:8485/bd1805</value>
</property>

<property>
   <name>dfs.journalnode.edits.dir</name>
   <value>/home/mx/data/hadoopdata/journaldata</value>
</property>

<property>
   <name>dfs.ha.automatic-failover.enabled</name>
   <value>true</value>
</property>


<property>
   <name>dfs.client.failover.proxy.provider.bd1805</name>
   <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
   <name>dfs.ha.fencing.methods</name>
   <value>
   sshfence
   shell(/bin/true)
   </value>
</property>

<property>
   <name>dfs.ha.fencing.ssh.private-key-files</name>
   <value>/home/mx/.ssh/id_rsa</value>
</property>

<property>
   <name>dfs.ha.fencing.ssh.connect-timeout</name>
   <value>30000</value>
</property>
-------------------------------------
   4）mapred-site.xml
-------------------------------------

<property>
   <name>mapreduce.framework.name</name>
   <value>yarn</value>
</property>

<property>
   <name>mapreduce.jobhistory.address</name>
   <value>hadoop06:10020</value>
</property>

<property>
   <name>mapreduce.jobhistory.webapp.address</name>
   <value>hadoop06:19888</value>
</property>
---------------------------
   5)yarn-site.xml
---------------------------

<property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
</property>

<property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>yarnha</value>
</property>

<property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
</property>

<property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>hadoop07</value>
</property>
<property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>hadoop08</value>
</property>

<property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>hadoop05:2181,hadoop06:2181,hadoop07:2181</value>
</property>

<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>

<property>
   <name>yarn.log-aggregation-enable</name>
   <value>true</value>
</property>

<property>
   <name>yarn.log-aggregation.retain-seconds</name>
   <value>86400</value>
</property>

<property>
   <name>yarn.resourcemanager.recovery.enabled</name>
</property>

<property>
   <name>yarn.resourcemanager.store.class</name>
   <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
-----------------------
   6)配置从节点
-----------------------
vi slaves

hadoop05
hadoop06
hadoop07
hadoop08

5.远程发送hadoop的安装包和环境变量
cd /home/mx/apps

   scp -r hadoop-2.7.6 hadoop06:/home/hadoop/apps/
   scp -r hadoop-2.7.6 hadoop07:/home/hadoop/apps/
   scp -r hadoop-2.7.6 hadoop08:/home/hadoop/apps/

之前配置过环境变量，添加了软连接不需要再次配置
但需要重新加载环境变量
source /etc/profile

查看hadoop版本信息
hadoop version

================================================================
6.格式化并启动集群（严格按照顺序执行！！！）
----------------------------------------------------------------
   1）启动zookeeper
   hadoop05/hadoop06/hadoop7三个节点启动zookeeper
       zkServer.sh start

zkServer.sh status查看是否启动成功
----------------------------------------------------------------
2)启动journalnode 存放共享文件的

   各个节点～目录上启动：（没要求）
   hadoop06:   hadoop-daemon.sh start journalnode
   hadoop07:   hadoop-daemon.sh start journalnode
   hadoop08:   hadoop-daemon.sh start journalnode
----------------------------------------------------------------
   3)格式化namenode
       在一个namenode节点上进行格式化(hadoop05或者hadoop06)

hadoop05：hadoop namenode -format
将这个节点的格式化的数据发送到另外一个namenode节点中

   scp -r /home/mx/data/hadoopdata/dfs hadoop06:/home/mx/data/hadoopdata/
----------------------------------------------------------------
   4)格式化zkfc 在一个namenode节点上就可以
       hdfs zkfc -formatZK
       在zookeeper集群中创建namenode的相关状态信息存储目录
----------------------------------------------------------------
   5）启动hadoop集群
       先启动hdfs
       start-dfs.sh 在任意节点执行

启动yarn：最好在yarn的主节点执行任意一个resourcemanager的节点hadoop07/hadoop08
start-yarn.sh

   注意：
   这里只能启动当前节点的resourcemanager 另外一个节点的resourcemanager需要手动启动
       yarn-daemon.sh start resourcemanager
------------------------------------------------------------------

查看各主节点的状态
HDFS:
hdfs haadmin -getServiceState nn1
hdfs haadmin -getServiceState nn2

YARN:
yarn rmadmin -getServiceState rm1
yarn rmadmin -getServiceState rm2

------------------------------------------------------------------
测试：
   hdfs的测试：
       namenode的节点：
           hadoop05:50070
           hadoop06:50070

   主备切换：
       kill activenamenode
   yarn的测试：
       resourcemanager节点：
           hadoop07:8088
           hadoop08:8088

--------------------------------------------------------
1、干掉 active namenode,standby变为active 重新启动---standby

2、在上传文件的时候干掉 active namenode，文件上传不受影响

3、干掉 active resourcemanager， standby变为active 重新启动---standby

4、在执行任务的时候干掉 active resourcemanager，任务不受影响