Hbase安装部署(进阶介绍 二)

目录

部署前提

​编辑

HBase的解压

解压Hbase到指定目录

改名

配置环境变量

使用source让配置的环境变量生效

HBase的配置文件

hbase-env.sh修改内容,可以添加到最后

hbase-site.xml修改内容:

hbase-site.xml配置项详解

1. 运行模式

2. 临时目录

3. 流能力安全检查

4. ZooKeeper集群

5. HBase根目录

6. WAL提供者

综合解释

regionservers

解决HBase和Hadoop的log4j兼容性问题,修改HBase的jar包,使用Hadoop的jar包

HBase远程发送到其他集群

HBase服务的启动

单点启动

群启

对应的停止服务

高可用(可选)

关闭HBase集群(如果没有开启则跳过此步)

在conf目录下创建backup-masters文件

在backup-masters文件中配置高可用HMaster节点

将整个conf目录scp到其他节点

重启hbase,打开页面测试查看

虚拟机启动集群成功照片


部署前提

保证Hadoop和zookeeper集群可以正常启动

HBase的解压

解压Hbase到指定目录

tar -zxvf hbase-2.4.11-bin.tar.gz -C /opt/module/

改名

mv /opt/module/hbase-2.4.11 /opt/module/hbase

配置环境变量

sudo vim /etc/profile.d/my_env.sh

使用source让配置的环境变量生效

source /etc/profile.d/my_env.sh

HBase的配置文件

cd到hbase的conf目录

hbase-env.sh修改内容,可以添加到最后

export HBASE_MANAGES_ZK=false

hbase-site.xml修改内容:

hbase-site.xml配置项详解

1. 运行模式

<property> <name>hbase.cluster.distributed</name> <value>true</value> </property>

  • hbase.cluster.distributed:定义HBase的运行模式。
    • true:HBase以分布式模式运行,这是生产环境中的常用设置。
    • false:HBase以单机模式运行,通常用于开发和测试环境。
2. 临时目录

<property> <name>hbase.tmp.dir</name> <value>./tmp</value> </property>

  • hbase.tmp.dir:指定HBase使用的临时目录。
    • ./tmp:表示临时文件将存储在当前目录的tmp文件夹中。这个目录用于存储HBase在运行过程中生成的临时文件。
3. 流能力安全检查

<property> <name>hbase.unsafe.stream.capability.enforce</name> <value>false</value> </property>

  • hbase.unsafe.stream.capability.enforce:决定是否强制执行流能力安全检查。
    • false:表示禁用流能力的强制检查。某些文件系统可能不支持流能力,禁用此检查可以避免相关问题。
    • true:表示启用流能力的强制检查,以确保文件系统的安全性。
4. ZooKeeper集群

<property> <name>hbase.zookeeper.quorum</name> <value>hadoop102,hadoop103,hadoop104</value> <description>The directory shared by RegionServers.</description> </property>

  • hbase.zookeeper.quorum:指定ZooKeeper集群的主机名或IP地址列表。
    • hadoop102,hadoop103,hadoop104:表示ZooKeeper集群中的三个节点。HBase使用ZooKeeper进行分布式协调,管理元数据和配置信息。
5. HBase根目录

<property> <name>hbase.rootdir</name> <value>hdfs://hadoop102:8020/hbase</value> <description>The directory shared by RegionServers.</description> </property>

  • hbase.rootdir:指定HBase数据存储的根目录。
    • hdfs://hadoop102:8020/hbase:表示HBase的数据存储在HDFS上,根目录为/hbase。使用HDFS路径格式,指定主节点(例如hadoop102)和端口(例如8020)。
6. WAL提供者

<property> <name>hbase.wal.provider</name> <value>filesystem</value> </property>

  • hbase.wal.provider:指定Write-Ahead Log (WAL)的提供者。
    • filesystem:表示使用文件系统作为WAL的存储介质。WAL用于记录写操作日志,以保证数据的持久性和故障恢复。
综合解释

这些配置项共同作用,定义了HBase集群的基本运行环境和存储策略:

  1. 运行模式:通过hbase.cluster.distributed设置HBase为分布式模式,以便在多台机器上运行。
  2. 临时目录:通过hbase.tmp.dir指定HBase运行过程中使用的临时目录。
  3. 流能力安全检查:通过hbase.unsafe.stream.capability.enforce决定是否启用流能力的强制检查。
  4. ZooKeeper集群:通过hbase.zookeeper.quorum指定ZooKeeper集群的节点信息,用于分布式协调。
  5. 数据存储位置:通过hbase.rootdir指定HBase数据在HDFS上的根目录,确保所有RegionServer共享同一个存储位置。
  6. WAL提供者:通过hbase.wal.provider确定使用文件系统作为WAL的存储介质,以保证数据写入操作的持久性和可靠性。

通过合理配置这些参数,可以确保HBase集群稳定、高效地运行,并且具备良好的容错和恢复能力

regionservers

RegionServers绑定的主机名

解决HBase和Hadoop的log4j兼容性问题,修改HBase的jar包,使用Hadoop的jar包

        解决HBase和Hadoop的log4j兼容性问题以及调整相应的jar包通常是为了避免日志记录系统之间的冲突,并确保日志的正确记录和管理

mv/opt/module/hbase/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar /opt/module/hbase/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar.bak

HBase远程发送到其他集群

xsync /opt/module/hbase/

HBase服务的启动

单点启动

在hbase目录执行:

bin/hbase-daemon.sh start master

bin/hbase-daemon.sh start regionserver

群启

start-hbase.sh

对应的停止服务

stop-hbase.sh

成功启动图片查看HBase页面

启动成功后,可以通过“host:port”的方式来访问HBase管理页面,例如http://hadoop102:16010

高可用(可选)

在HBase中HMaster负责监控HRegionServer的生命周期,均衡RegionServer的负载,如果HMaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对HMaster的高可用配置

关闭HBase集群(如果没有开启则跳过此步)

stop-hbase.sh

在conf目录下创建backup-masters文件

touch conf/backup-masters

在backup-masters文件中配置高可用HMaster节点

将整个conf目录scp到其他节点

xsync /opt/module/hbase/conf/

重启hbase,打开页面测试查看

start-hbase.sh

http://hadooo102:16010

 点击hadoop103出现以下页面就代表部署成功了

部署高可用是因为,当主master挂掉从master可以代替主master工作。

虚拟机启动集群成功照片

分布式数据库 分布式数据库 分布式数据库数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 是数据库技术与网络相结合的产物,分布式系统建立在 网上的 网上的 软件系统, 软件系统, 软件系统, 具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作具有高度的 透明性,在分布式数据库系统中用户是感觉不到就好像操作是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是一个统的整体,即用户不须知道关系否分割、有无副本数据库存于哪台机器及操作 是
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值