一、 读取流程

- Client 访问Zookeeper, 获取 hbase:meta表,位于哪个RegionServer。
Client在读取HBase数据过程中,我们是不知道具体的数据时是存放在哪个RegionServer的哪个Region中的,这些信息存放在HBase的meta表中。而meta表的信息则是存放在Zookeeper中的。因此,Client需要先访问zookeeper,取得其中的HBase:meta表信息,这样就可以知道meta表存放的RegionServer的ip地址和端口号了。
- 访问对应的RegionServer,获取其中存放的HBase:meta表,根据读请求中的 namespace:table/rowkey,查询出目标数据位于RegionServer的哪个region中 。并将该 table 的 region 信息以 及 meta 表的位置信息缓存在客户端的 meta cache,方便下次访问。
- 从RegionServer,查找对应的Region。分别访问Region中的MemStore(写缓存);继续在BlockCache(读缓存)中查找数据;继续在StoreFile中查询目标数据(HDFS中存储的HFile)。将所有查询到的数据进行合并。(如果是范围读取,则是将三者的查询数据合并在一起)
- 将查询到的数据缓存在BlockCache中
- 将查询结果返回给Client

本文详细介绍了HBase的数据读取和写入流程。在读取时,Client首先通过Zookeeper获取meta表信息,然后访问对应RegionServer,查找Region并从MemStore、BlockCache和StoreFile中检索数据。写数据时,同样先获取meta表信息,接着数据写入WAL和MemStore,确保数据安全性,最后在合适时机将MemStore内容刷入StoreFile。
最低0.47元/天 解锁文章
508

被折叠的 条评论
为什么被折叠?



