HBase理论概述

HBase理论概述

HBase基本介绍

HBase是一个面向列式存储的分布式数据库,它底层存储基于HDFS实现,而集群管理则依赖于ZooKeeper。

HBase的架构

HBase组件角色:

HMaster
  • 监控RegionServer
  • 处理RegionServer故障转移
  • 处理元数据的变更
  • 处理region的分配或移除
  • 在空闲时间进行数据的负载均衡
  • 通过Zookeeper发布自己的位置给客户端
HRegionServer
  • 负责存储HBase的实际数据
  • 处理分配给它的Region
  • 刷新缓存到HDFS
  • 维护WAL(Write-Ahead Logging)
  • 执行压缩
  • 负责处理Region分片
HFile
  • 磁盘上保存原始数据的实际物理文件。
Store
  • HFile存储在Store中,一个Store对应HBase表中的一个Column Family列族(列簇)。
MemStore
  • 内存存储,用来保存当前的数据操作,位于内存中。

HBase部署与启动

部署步骤:

  1. 下载并解压缩HBase。

  2. /etc/profile全局配置文件中添加HBase环境变量:

    export HBASE_HOME=/export/servers/hbase-2.4.5
    export PATH=$PATH:$HBASE_HOME/bin
    
  3. 配置hbase-env.sh

    export JAVA_HOME=/export/servers/jdk1.8.0_161
    export HBASE_MANAGES_ZK=false  # 使用外部的ZooKeeper
    
  4. 配置hbase-site.xml

  5. 拷贝ZooKeeper的conf/zoo.cfg到HBase的conf/下。

  6. 启动HBase:

    • 执行start-hbase.sh脚本。

注意事项:

为了方便启动,可在/etc/profile中添加环境变量。

HBase表结构

HBase的表结构设计是围绕列族组织的,每个列族在物理存储上作为一个Store单元存在。数据按列族进行分割和存储,提高了数据访问的效率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值