Hadoop----QJM的高可用性

本文详细介绍了如何通过QJM(Quorum Journal Manager)解决Hadoop集群中Namenode的单点故障问题,确保高可用性。内容包括高可用性的原理,如两台NameNode的主备配置、JournalNode的角色以及防止脑裂的情景,以及实施高可用性的硬件需求和配置步骤。在集群中设置JournalNode,并确保元数据同步,最后测试了HA集群的切换和文件系统的稳定性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 问题:集群的Namenode存在单点故障
  2. 解决方式:
    (1)使用QJM(Quorum Journal Manager)的HDFS高可用性
    (2)使用NFS的高可用性
  3. 影响可用性的两个主要方面
    (1)计划外事件(例如计算机崩溃)
    (2)计划内事件(如NameNode计算机上的软件或硬件升级)将导致群集停机时间段。
  4. 高可用的简介:
    (1)只有两台独立的计算机配置为NameNode,其中一个NameNode处于活动状态(active),另外一个Namenode只是充当从属服务器(Standby)
    (2)在集群中配置一组"journalnode",记录活跃Namenode的编辑信息,同时传给备份Namenode,并防止"脑裂情景"的发生(JournalNodes只允许一个NameNode一次成为一个writer)
    (3)datanode要向两个Namenode进行心态反馈
  5. 硬件需求:
    (1)namenode的计算机硬件应该相同,保持一致。
    (2)journalnode的计算机硬件要求不高,可以在从节点上,运行的个数为奇数个(至少3个),允许的故障个数为(n-1)/2
  6. 配置
    (1)在hdfs-site.xml里:
    
    a.配置名称服务的昵称
    <property>
		<name>dfs.nameservices</name> 
		<value>mycluster</value>
    </property>
   
    b.为名称服务配置相应的ID唯一标识符:用逗号分开,注意:目前,每个名称服务最多只能配置两个NameNode。
    <property>
		<name>dfs.ha.namenodes.mycluster</name>
		<value>nn1,nn2</value>
    </property>
   
    c.为名称服务的唯一标识符,配置独立完整的rpc地址
    <property>
		<name>dfs.namenode.rpc-address.mycluster.nn1</name>
		<value>master:9000</value>
    </property>
    <property>
		<name>dfs.namenode.rpc-address.mycluster.nn2</name>
		<value>slave1:9000</value>
    </property>
   
    d.为名称服务的唯一标识符,配置独立完整的http地址
    <property>
		<name>dfs.namenode.http-address.mycluster.nn1</name>
		<value>master:50070</value>
    </property>
    <property>
		<name>dfs.namenode.http-address.mycluster.nn2</name>
		<value>slave1:50070</value>
    </property>
   
    f.指定journalnode守护进程所在的机器,及其指定目录(即重用名称服务的值)
    <property>
		<name>dfs.namenode.shared.edits.dir</name>
		<value>qjournal://master:8485;slave2:8485;slave3:8485/mycluster</value>
    </property>
   
    g.配置client用于联系ActiveNamenode的java类型
    <property>
		<name>dfs.client.failover.proxy.provider.mycluster</name>
		<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
  
    h.配置防护方式:sshfence,让journalnode守护进程防止脑裂的产生,还必须配置无密码登陆
     <property>
		<name>dfs.ha.fencing.methods</name>
		<value>sshfence</value>
    </property>

    <property>
		<name>dfs.ha.fencing.ssh.private-key-files</name>
		<value>/home/hyxy(用户名)/.ssh/id_rsa</value>
    </property>


    (2)在core-site.xml中:

    a.配置默认的namenode的请求路径
    <property>
		<name>fs.defaultFS</name>
		<value>hdfs://mycluster</value>
    </property>
    b.配置journalnode所产生的目录的具体路径(说明:mycluster目录的位置)
    <property>
		<name>dfs.journalnode.edits.dir</name>
		<value>/home/hyxy(用户名)/apps/hadoop/tmp</value>
    </property>

在集群中进行配置

hdfs-site.xml
在这里插入图片描述
在这里插入图片描述
core-site.xml
在这里插入图片描述

具体细节:

  1. 配置完成后
    在这里插入图片描述
    将配置文件发送到从节点上
scp -r hadoop_ha wyc@slave1:~/apps/hadoop/etc/

启动相应节点上的journalnode守护进程,

ssh master/slave2/slave3
hadoop-daemon.sh start journalnode

在这里插入图片描述

  1. 同步元数据

(1)如果是新搭建的集群,选择其中一个namonde所在的机器进行格式化。

hdfs namenode -format

(2)将已经格式化的namenode的元数据同步到另外一个未格式化的namenode上。
目的:就是在另一个未格式化的机器上,生成${hadoop.tmp.dir}/dfs/name,存储最新的镜像文件

a.开启格式化好的namenode

 hadoop-daemon.sh start namenode

在这里插入图片描述

b.在未格式化的namenode上,运行如下命令,同步元数据

hdfs namenode -bootstrapStandby

在这里插入图片描述
在这里插入图片描述
(3).将本地的元数据初始化到journalnode里

a.关闭namenode

hadoop-daemon.sh stop namenode

b. 初始化,注意,journalnode必须是开启的(n-1/2)

 hdfs namenode -initializeSharedEdits

在这里插入图片描述
在这里插入图片描述

注意:若是失败,可检查nn1和nn2主机上~/apps/hadoop/etc/目录下 是否创建软链接

  1. 开启HA集群
start-dfs.sh

开启顺序:
(1)namenode
(2)datanode
(3)journalnode

在这里插入图片描述
4. 测试
(1)查看两个namenode的50070的状态信息
ip:50070
在这里插入图片描述
在这里插入图片描述
(2)使用命令工具 进行状态切换standby <–> active

hdfs haadmin -transitionToActive nn1

在这里插入图片描述
浏览器查看状态
在这里插入图片描述

(3) 上传文件/创建目录
在这里插入图片描述
在这里插入图片描述
(4)kill掉 active主机的namenode(或者切换active状态为standby),查看另一个状态

hadoop-daemon.sh stop namenode
或者
hdfs haadmin -transitionToStandby nn1

在这里插入图片描述
在这里插入图片描述

(5)将备份namenode 转换成active,检查文件系统是否可用

hdfs haadmin -transitionToActive --forceactive nn2
注意:(--forceactive )是强制切换,是执行了杀死namenode进程命令时候使用

在这里插入图片描述
在这里插入图片描述

查看创建的目录是否存在
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值