hbase读写流程

本文概述了HBase写入数据的详细步骤,包括元数据查找、WAL与Memstore操作,以及读取流程中的数据查询路径。同时介绍了MemstoreFlush触发条件、StoreFileCompaction的不同类型和RegionSplit的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.hbase写数据流程 ,hbase写比读还快
先找zookeeper中meta表的元数据信息,再找到rgionserver节点先写wal,把wal追加到最后一次的wal中,但不同步,再写memstore,若wal写失败,则回滚memstore
2.memstore flush
regionserver达到堆内存的40%,或者单个region大小达到128M,或者HLog大小达到限制值
3.hbase读流程
客户端先访问zookeeper,获取hbase:meta表位于哪个regionserver,分别在读缓存,memstore,storeFile中查询目标数据,返回时间戳字段最新的数据
4.storeFile compaction
Minor Compaction:会将临近的若干个较小的HFile合并成一个较大的HFile,但不会清理过期和删除的数据,Major Compaction会将一个Store下的所有HFile合并成一个较大的HFile,并且会清理掉过期和删除的数据。
5.region split
根据storeFile的大小和数量切分

`


HDFS (Hadoop Distributed File System) 和 HBase 是 Apache Hadoop 生态系统中的两个重要组件,它们在分布式数据存储和处理中有各自的角色。 HDFS 读写流程大致如下: 1. **客户端发起请求**:用户通过 HDFS API 向 NameNode 发出文件操作请求(如读取或写入),NameNode 负责全局文件系统的元数据管理。 2. **元数据查询**:NameNode 接收请求后,验证权限并返回文件块的位置信息给客户端。 3. **数据定位**:客户端根据 NameNode 提供的信息找到 DataNode 的地址列表。 4. **数据传输**:客户端将数据分片(Block)发送到相应的 DataNode,并记录副本数以保证数据冗余。 5. **DataNode 数据接收和处理**:当 DataNode 收到数据后,将其写入磁盘并更新自身的块列表。 6. **读取过程**:如果需要读取数据,客户端同样先向 NameNode 查询文件位置,然后从 DataNode 获取数据。 HBase读写流程: 1. **客户端连接**:客户端通过 Java API 或其他客户端库连接到 ZooKeeper 集群获取 HBase Master 的地址。 2. **表和行键查询**:客户端将表名、行键发送到 Master,Master 返回 RegionServer 的位置。 3. **RegionServer定位**:客户端找到负责该 Region 的 RegionServer。 4. **数据读写**:对于写入操作,客户端将请求发送到 RegionServer,RegionServer 将数据写入 MemStore,之后可能会触发 Compaction 过程,将 MemStore 中的数据刷入 HFile 到硬盘;读取操作则直接从 HFile 中查找数据。 5. **结果返回**:读写完成后,结果通过网络返回给客户端。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值