Hbase table structure
默认返回每个列的最新数据值
两种数据回收方式:
对每个列指定个数的历史版本记录
对每个列指定时间段内的历史版本记录
Table
Region(Hmaster实现映射到region server)
Regionserver
Store
{memStore( trigger 1.累积到阈值时 Region server 将memstore刷到storeFile中)
storeFile ->Hfile on hdfs (trigger 2.累积到阈值时合并成大storeFile,同时进行数据清除)
}
trigger 3.当大storeFile累计到阈值时,把当前Region分割成两个regions由Hmaster分配Region实现负载均衡
Hmaster
将Region分配给Regionserver
将失效的regions重分配 -> 负载均衡
Metadata management
故障时通知zookeeper并处理相应的 log文件
HRegionServer
负责所有region的读写请求
Region
structure
附上region的structure
Metadata存储于.META.表中
会分裂成多个region
存储于-ROOT- 表中
Zookeeper记录-ROOT-表位置
访问流程
Zookeeper-> -ROOT- -> .META.
本文介绍了Hbase表结构,默认返回各列最新数据值,有指定个数和时间段两种历史版本记录回收方式。阐述了Table、Region、Regionserver等组件的功能及触发机制,如memstore刷写、storeFile合并等,还提及Hmaster的负载均衡、元数据管理,以及访问流程。
11万+

被折叠的 条评论
为什么被折叠?



