HBase基础知识点

最新推荐文章于 2025-10-01 10:09:46 发布

原创

最新推荐文章于 2025-10-01 10:09:46 发布 · 5.2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

这篇博客介绍了HBase的基本概念，如其作为稀疏、多维、有序映射表的特性，以及行键、列键和时间戳的索引方式。文章讨论了HBase适合高读写场景、非结构化数据存储、分布式等特点，并对比了常见大数据产品。详细阐述了HBase的数据查询流程，包括.HMETA.表、-ROOT-表和Zookeeper的角色。此外，还涉及了WAL日志、HRegion、StoreFile、HFile等核心概念。最后，提到了HBase的删除机制以及常用命令和Java API的使用。

HBase 基本概念

存储的是松散型的数据类型
在HBase中行健按照字典序升序存储
基于行健，列键，时间戳建立索引
HBase客户端访问方式包括API、使用HBase Shell访问、通过控制台进行访问
HBase在Hadoop上通过HDFS系统存储底层数据，可实现多机同时读写
HBase是一个稀疏的长期存储的，多维度的，有序的映射表，该表的索引是行健，列关键字和时间戳

HBase 的基本特点

适合高读写的场景
存储稀疏矩阵
分布式，适合集群化运行
非结构化
开源
列式数据库

常见的大数据库产品

Google的BigTable
Apache的Cassandra、HBase

HBase相关

.META.存储的是用户表的信息（元数据）即：在哪一个用户的哪一个region里
在HBase物理模型中客户端检索数据时，先在内存中找，找不到时再去磁盘中找
Client如何从HBase中查询数据

zookeeper file中记录了-ROOT-表的Location

-ROOT-
记录了.META表的Region信息
-ROOT- 只有一个Region
将.META中的Region映射到Region Server上
该表主要存储了.META服务器位置以及映射了那些META Region

.META
记录了用户表的Region信息
.META可以有多个Region
包括Region中数据起止行信息，Region“在线”状态等
保存Region Server

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。