HBase 基本概念
- 存储的是松散型的数据类型
- 在HBase中行健按照字典序升序存储
- 基于行健,列键,时间戳建立索引
- HBase客户端访问方式包括API、使用HBase Shell访问、通过控制台进行访问
- HBase在Hadoop上通过HDFS系统存储底层数据,可实现多机同时读写
- HBase是一个稀疏的长期存储的,多维度的,有序的映射表,该表的索引是行健,列关键字和时间戳
HBase 的基本特点
- 适合高读写的场景
- 存储稀疏矩阵
- 分布式,适合集群化运行
- 非结构化
- 开源
- 列式数据库
常见的大数据库产品
Google的BigTable
Apache的Cassandra、HBase
HBase相关
.META.存储的是用户表的信息(元数据)即:在哪一个用户的哪一个region里

在HBase物理模型中客户端检索数据时,先在内存中找,找不到时再去磁盘中找
Client如何从HBase中查询数据

zookeeper file中记录了-ROOT-表的Location
-ROOT-
记录了.META表的Region信息
-ROOT- 只有一个Region
将.META中的Region映射到Region Server上
该表主要存储了.META服务器位置以及映射了那些META Region
.META
记录了用户表的Region信息
.META可以有多个Region
包括Region中数据起止行信息,Region“在线”状态等
保存Region Server

这篇博客介绍了HBase的基本概念,如其作为稀疏、多维、有序映射表的特性,以及行键、列键和时间戳的索引方式。文章讨论了HBase适合高读写场景、非结构化数据存储、分布式等特点,并对比了常见大数据产品。详细阐述了HBase的数据查询流程,包括.HMETA.表、-ROOT-表和Zookeeper的角色。此外,还涉及了WAL日志、HRegion、StoreFile、HFile等核心概念。最后,提到了HBase的删除机制以及常用命令和Java API的使用。
最低0.47元/天 解锁文章
2237

被折叠的 条评论
为什么被折叠?



