HBase数据库面试知识点:第一部分 - 基础概念与特点(持续更新中)

目录

一、HBase基础概念

1. HBase定义

2. 核心组件

3. HBase的特点

二、HBase与传统RDBMS的区别

1. 数据类型

2. 数据操作

3. 存储方式

4. 伸缩性

5. 事务性

三、HBase数据模型

四、HBase的特点

五、HBase与Hadoop生态系统的关系


一、HBase基础概念

1. HBase定义

HBase是一个开源的、分布式的、面向列的NoSQL数据库,它是Apache Hadoop生态系统中的一部分。HBase基于Hadoop的分布式文件系统(HDFS)来存储数据,并提供了高可靠性、高性能、可伸缩性和面向列的数据存储能力。HBase的设计初衷是为了解决传统关系型数据库(RDBMS)在处理大规模数据集时的性能瓶颈和扩展性问题。

2. 核心组件

  • HBase Master:负责处理客户端的写请求,管理Region的分配和负载均衡,以及维护集群的状态信息。
  • HBase RegionServer负责数据的存储和读取,管理多个Region。
  • RegionHBase数据表在物理存储上的划分单元,每个Region由多个Store组成。
  • Store存储某个列族(ColumnFamily)数据的场所,包含多个MemStore和一个或多个HFile。
  • MemStore位于RegionServer内存中,用于暂存新写入的数据,待数据达到一定大小或达到触发条件后,会将其刷新到HFile中。
  • HFileHBase中数据的物理存储格式,是存储在HDFS上的二进制文件。

3. HBase的特点

  • 高可扩展性HBase通过水平扩展可以支持PB级别的数据存储,集群中的节点数量可以动态增加或减少,以应对数据增长和访问压力的变化。
  • 高可靠性HBase通过数据复制和分布存储实现高可靠性。默认情况下,每个Region的数据会复制三份存储在不同的RegionServer上,确保数据的冗余和容错。此外,HBase还利用ZooKeeper来实现集群的协调和管理,确保服务的高可用性和稳定性。
  • 高性能HBase支持高速的读写操作,尤其适用于实时数据访问和处理场景。其面向列的存储模式使得在读取特定列数据时具有更高的效率,减少了不必要的IO开销。
  • 面向列与传统的行式存储数据库不同,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值