HBase HA完全分布式环境搭建

最新推荐文章于 2023-10-01 15:52:32 发布

莫言静好、

最新推荐文章于 2023-10-01 15:52:32 发布

阅读量2.7k

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据/hbase 文章标签： hbase HA 集群分布式

本文链接：https://blog.youkuaiyun.com/zhanglh046/article/details/78510224

大数据/hbase 专栏收录该内容

16 篇文章

订阅专栏

本文详细介绍HBase集群的部署架构、系统参数设置、解压安装、环境变量配置及启动流程。涵盖Master与RegionServer节点规划、核心配置文件hbase-site.xml的详细参数设置。

一集群部署架构介绍

Master节点一主一备，跟HadoopNameNode 保持一致，即HBase

Master也把主从节点放在NameNode主从同一台机器

RegionServer放在每一个对应DataNode上，比如我由三个DataNode，那么每一台DataNode对应的Server也会放一个RegionServer

节点规划信息：

二企业级系统参数设置

查看Linux系统最大进程数和最大文件打开数

可根据具体情况调整，包括以下内核参数：

net.ipv4.ip_forward=0

net.ipv4.conf.default.rp_filter=1

net.ipv4.conf.default.accept_source_route=0

kernel.core_users_pid=1

net.ipv4.tcp_syncookies=1

net.bridge.bridge-nf-call-ip6tables=0

net.bridge.bridge-nf-call-iptables=0

net.bridge.bridge-nf-call-arptables=0

kernel.mggmnb=65536

kernel.mggmax=65536

kernel.shmmax=68719476736

kernel.shmall=268435456

net.ipv4.tcp_max_syn_backlog=65000

net.core.netdev_max_backlog=32768

net.core.somaxconn=32768

fs.file-max=65000

net.core.wmem_default=8388608

net.core.rmem_default=8388608

net.core.rmem_max=16777216

net.core.wmem_max=16777216

net.ipv4.tcp_timestamps=1

net.ipv4.tcp_synack_retries=2

net.ipv4.tcp_syn_retries=2

net.ipv4.tcp_mem=94500000 915000000 927000000

net.ipv4.tcp_max_orphans=3276800

net.ipv4.tcp_tw_reuse=1

net.ipv4.tcp_tw_recycle=1

net.ipv4.tcp_keepalive_time=1200

net.ipv4.tcp_syncookies=1

net.ipv4.tcp_fin_timeout=10

net.ipv4.tcp_keepalive_intvl=15

net.ipv4.tcp_keepalive_probes=3

net.ipv4.ip_local_port_range=1024 65535

net.ipv4.conf.eml.send_redirects=0

net.ipv4.conf.lo.send_redirects=0

net.ipv4.conf.default.send_redirects=0

net.ipv4.conf.all.send_redirects=0

net.ipv4.icmp_echo_ignore_broadcasts=1

net.ipv4.conf.eml.accept_source_route=0

net.ipv4.conf.lo.accept_source_route=0

net.ipv4.conf.default.accept_source_route=0

net.ipv4.conf.all.accept_source_route=0

net.ipv4.icmp_ignore_bogus_error_responses=1

kernel.core_pattern=/tmp/core

vm.overcommit_memory=1

三解压

tar-zxf ./hbase-1.0.0-cdh5.5.0.tar.gz -C /opt/app/

四配置HBase的hbase-env.sh里的相关参数

exportJAVA_HOME=/opt/app/java

exportHADOOP_HOME=/opt/app/hadoop

exportHBASE_HEAPSIZE=1024

exportHBASE_OPTS="-XX:+UseConcMarkSweepGC"

exportHBASE_MASTER_OPTS="${HBASE_MASTER_OPTS} -Xmx512m"

exportHBASE_REGIONSERVER_OPTS="${HBASE_REGIONSER

VER_OPTS}-Xmx1024m"

exportHBASE_LOG_DIR=${HBASE_HOME}/logs

exportHBASE_PID_DIR=${HBASE_HOME}/pids

#不使用HBase自己的zookeeper

exportHBASE_MANAGES_ZK=false

五配置hbase-site.xml

HMasterhadoop-all-01 hadoop-all-02

HRegionServerhadoop-all-01 hadoop-all-02 hadoop-all-03

<name>hbase.tmp.dir</name>

<value>/opt/app/hbase/data</value>

</property>

<name>hbase.rootdir</name>

<value>hdfs://hdfs-cluster/hbase</value>

</property>

<name>hbase.master.port</name>

</property>

<name>hbase.master.info.port</name>

</property>

<name>hbase.cluster.distributed</name>

</property>

<name>hbase.zookeeper.quorum</name>

<value>hadoop-all-01,hadoop-all-02,hadoop-all-03</value>

</property>

<name>hbase.zookeeper.property.clientPort</name>

</property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/opt/app/zookeeper-3.4.5/data</value>

</property>

<name>hbase.client.scanner.caching</name>

</property>

<name>hbase.hregion.max.filesize</name>

</property>

<name>hbase.regionserver.reginoSplitLimit</name>

</property>

<name>hbase.hstore.compactionThreshold</name>

</property>

<name>hbase.hstore.blockingStoreFiles</name>

</property>

<!--当MemStore占用内存大小超过hbase.hregion.memstore.flush.size

MemStore刷新缓存的大小的4倍，开始中block该HRegion的请求，进行flush

释放内存，后台会有服务线程在周期内hbase.server.thread.wakefrequency

定时检查-->

<name>hbase.hregion.memstore.block.multiplier</name>

</property>

<name>hbase.server.thread.wakefrequency</name>

</property>

<name>hbase.zookeeper.property.maxClientCnxns</name>

</property>

<name>hbase.regionserver.global.memstore.size</name>

</property>

<name>hbase.regionserver.global.memstore.size.lower.limit</name>

</property>

<name>hfile.block.cache.size</name>

</property>

<name>hbase.regionserver.handler.count</name>

</property>

<name>hbase.client.retries.number</name>

</property>

<name>hbase.client.pause</name>

</property>

</configuration>

六配置regionservers

vimregionservers,把HRegionServer对应的host添加进去

hadoop-all-01

hadoop-all-02

hadoop-all-03

七配置backup-masters文件

hadoop-all-02

八创建必要的目录

mkdir-p /opt/app/hbase/data logs pids

九把已经配置好的hbase分发到其他节点

删除hbase的slf4j-log4j12-1.7.5.jar，解决hbase和hadoop的LSF4J包冲突

mvslf4j-log4j12-1.7.5.jar slf4j-log4j12-1.7.5.jar.bak

删除/opt/app/hbase-1.0.0-cdh5.5.0/docs

scp-r hbase-1.0.0-cdh5.5.0/ hadoop@hadoop-all-02:/opt/app/

scp-r hbase-1.0.0-cdh5.5.0/ hadoop@hadoop-all-03:/opt/app/

然后每一个节点给该文件创建软连接指向/opt/app/hbase

ln-s /opt/app/hbase-1.0.0-cdh5.5.0 /opt/app/hbase

十每一个节点添加环境变量

vim~/.bashrc

#HBASE_HOME

exportHBASE_HOME=/opt/app/hbase

exportPATH=$PATH:$HBASE_HOME/bin

保存之后，source~/.bashrc

十一启动HBASE集群

首先确保所有ZK NNDN RM NM已经启动

start-hbase.sh所有的HMaster和HRegionServer都会启动

然后访问WEB-UI:

http://hadoop-all-01:16010

http://hadoop-all-02:16010