hbase---高可用,集群架构,原理,工作机制,Bulk Load 批量加载操作

本文介绍了HBase的高可用性,包括如何在VMware环境中配置主节点高可用,以及集群架构。深入探讨了HBase的读写流程、flush和storeFile合并机制、region分裂原理。此外,还详细阐述了region server和master的上线、下线流程,并讲解了Bulk Load批量加载操作的步骤和适用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hbase的高可用

什么是hbase的高可用?
指的是:让master节点能够有多个,当节点宕机后,能够有备份的节点顶的上来,此时认为master形成了高可用状态

如何实现hbase的主节点的高可用呢?环境为VMware 三台虚拟机

  1. 在hbase的conf目录下,创建backup-master文件,并添加如下内容:
    node1中执行:
    	cd /export/server/hbase-2.1.0/conf/
    	vim backup-masters
    内容如下:
    	node2.itcast.cn
    	node3.itcast.cn
    
  2. 将这个文件发送到node2和node3中
    node1执行:
    	cd /export/server/hbase-2.1.0/conf/
    	scp backup-masters node2:$PWD
    	scp backup-masters node3:$PWD
    
  3. 启动hbase:
3.1) 先启动zookeeper
3.2) 接着启动 hadoop集群
3.3) 启动hbase
  1. 启动后, 可以将主节点进行宕机, 然后检测其他的节点是否升级为主节点操作, 如果可以, 说明高可用配置成功了
思考: 为什么第一次启动 每一次都node1成为主节点呢? 
	在启动过程中, node1往往是第一个先启动, 导致具有抢先权限, 导致node1往往是主节点

hbase的集群架构

在这里插入图片描述
在这里插入图片描述

Hbase的原理

hbase的读取流程
在这里插入图片描述
读取数据的流程:(注:防手机端看不清图片文字)

1. 客户端发起读取数据的请求,首先会连接zookeeper
2. 从zookeeper中获取hbase:meta表 被那个regionServer所管理着   
	(hbase:meta表Lhbase的元数据表,此表中主要适用于存储用户创建的表元数据信息,
		包含有哪些表,每个表有哪些region,每个region被那些regionServer所管理,以及每个
		region详细的信息数据。    如果执行get操作,只能返回一个regionServer地址,如果执行
		scan操作,将这个表对应的所有regionServer地址返回)
3.  连接meta表对应regionServer,从meta表中获取当前读取的这个表对应的region被哪个regionServer所管理
4. 连接对应的regionServer,开始读取数据
5. 首先现行memstore--》blockCache(块缓存)--》s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值