hbase快速入门之---系统架构


ØClient
HBase Client使用HBaseRPC机制与HMasterHRegionServer进行通信,对于管理类操作,ClientHMaster进行RPC;对于数据读写类操作,ClientHRegionServer进行RPC
ØZookeeper
Zookeeper Quorum中除了存储了-ROOT-表的地址和HMaster的地址,HRegionServer也会把自己以Ephemeral方式注册到Zookeeper中,使得HMaster可以随时感知到各个HRegionServer的健康状态。此外,Zookeeper也避免了HMaster的单点问题。
ØHmaster
HMaster没有单点问题,HBase中可以启动多个HMaster,通过ZookeeperMaster Election机制保证总有一个Master运行。
HMaster在功能上主要负责TableRegion的管理工作:
1.管理用户对Table的增、删、改、查操作
2.管理HRegionServer的负载均衡,调整Region分布
3.Region Split后,负责新Region的分配
4.HRegionServer停机后,负责失效HRegionServer上的Regions迁移

ØHRegionServer主要负责响应用户I/O请求,向HDFS文件系统中读写数据,是HBase中最核心的模块。

ØHRegionServer内部管理了一系列HRegion对象,每个HRegion对应了Table中的一个RegionHRegion中由多个HStore组成。每个HStore对应了Table中的一个Column Family的存储,可以看出每个Column Family其实就是一个集中的存储单元,因此最好将具备共同IO特性的column放在一个Column Family中,这样最高效。

ØHStore存储是 HBase存储的核心了,其中由两部分组成,一部分是MemStore,一部分是StoreFiles
ØMemStoreSorted Memory Buffer,用户写入的数据首先会放入 MemStore,当MemStore满了以后会Flush成一个StoreFile(底层实现是 HFile
ØStoreFile文件数量增长到一定阈值,会触发 Compact合并操作,将多个StoreFiles合并成一个 StoreFile,合并过程中会进行版本合并和数据删除,因此可以看出 HBase其实只有增加数据,所有的更新和删除操作都是在后续的compact过程中进行的,这使得用户的写操作只要进入内存中就可以立即返回,保证了HBase I/O的高性能。
ØStoreFiles Compact后,会逐步形成越来越大的StoreFile,当单个StoreFile大小超过一定阈值后,会触发 Split操作,同时把当前 Region  Split2Region,父 Region会下线,新 Split出的2个孩子Region会被HMaster分配到相应的HRegionServer 上,使得原先 1Region的压力得以分流到 2Region上。
Ø下图描述了CompactionSplit的过程。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值