HBase集群搭建实验(2)_伪分布式部署(使用内置ZooKeeper)

本文详细介绍了如何在单台Linux虚拟机上进行HBase的伪分布式部署,包括使用内置ZooKeeper,依赖Hadoop伪分布式环境,配置环境变量,修改配置文件,启动HDFS和HBase,并验证HBase是否成功连接HDFS。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 HBase伪分布式模式
1)HBase使用HDFS存储数据,所有进程运行在同一个节点上,不同的HBase或ZooKeeper守护进程运行在不同的JVM(Java Virtual Machine)中

2)使用HBase内置的ZooKeeper
3)比较适用于在硬件配置一般的用于开发的计算机上运行,适用于HBase的开发和测试环境

 

实验前提:HBase伪分布式部署依赖于Hadoop伪分布式部署,本实验紧接Hadoop伪分布式实验,在Hadoop伪分布式部署完成并运行成功的基础上,继续进行Hbase伪分布式部署实验

实验目标:单台Linux虚拟机主机上部署伪分布式数据库HBase ,用于教学演示

实验环境:    虚拟机VirtualBox     操作系统 Centos7    Hadoop版本  hadoop-2.6.0-cdh5.7.0    Hbase版本 hbase-1.2.0-cdh5.7.0.tar.gz    由于HBase依赖于HDFS,所以选择安装包版本时必须注意HBase和Hadoop的版本兼容性,官方发布的HBase各版本对JDK和Hadoop各版本的支持情况参考(版本兼容性):https://blog.youkuaiyun.com/e_wsq/article/details/81365029
集群规划:  无需复制虚拟机,直接利用Hadoop伪分布式的单台主机hadoop完成Hbase伪分布式部署

<think>好的,我需要帮助用户了解如何在伪分布式环境下搭建HBase使用内置ZooKeeper。根据用户提供的引用内容,我需要整理出配置步骤,并确保所有技术细节准确无误。 首先,用户提到了HBase伪分布式部署需要依赖HDFS,所以第一步应该是确认Hadoop环境已经配置好。引用[2]指出HBase的数据存储在HDFS上,因此必须先安装和启动Hadoop。需要提醒用户确保Hadoop正常运行,并检查HDFS的访问权限,避免HBase写入数据时出现问题。 接下来,用户需要下载并解压HBase。引用[1]和[4]提到了HBase的安装路径和配置文件的修改。我应该指导用户下载合适的HBase版本,解压到指定目录,并设置环境变量,如HBASE_HOME和PATH,以便于后续操作。 然后是配置HBase的核心文件。主要修改hbase-site.xml,这里需要参考引用[1]中的参数:hbase.rootdir指向HDFS的路径,hbase.cluster.distributed设置为true,hbase.zookeeper.property.dataDir指定ZooKeeper的数据存储路径。同时,确保使用内置ZooKeeper,所以需要检查hbase-env.sh中的HBASE_MANAGES_ZK是否为true。引用[3]提到如果使用外部ZooKeeper需要设置为false,但这里用户要求内置,所以保持默认或显式设置为true。 启动顺序也很重要。根据引用[4],需要先启动Hadoop,然后启动HBase。用户可能会忽略这一步,导致服务无法正常启动。此外,启动HBase后,使用jps命令检查进程,确认HMaster、HRegionServer以及ZooKeeper进程是否存在,这有助于验证配置是否正确。 最后,验证部署是否成功。通过HBase Shell执行status命令,查看集群状态,或访问Web界面。这部分需要给出具体的命令和预期结果,方便用户自查。 在整理步骤时,需要注意引用对应的参考文献,例如配置hbase.zookeeper.property.dataDir时引用[1],环境变量设置引用[4]和[5]。同时,确保所有配置项使用正确的LaTeX格式,如$HBASE_HOME$,独立公式用$$...$$,但在这个场景可能用不上,但行内变量需要用$符号包裹。 用户可能遇到的问题包括HDFS权限错误、端口冲突或配置参数错误,应在注意事项中提醒。例如,HBase需要与Hadoop版本兼容,内置ZooKeeper的默认端口是2181,需确保未被占用。 总结步骤:Hadoop环境准备→安装HBase→配置hbase-site.xml和hbase-env.sh→启动服务→验证。每个步骤引用相关文献,并保持语言简洁,结构清晰。</think>### HBase伪分布式部署配置(使用内置ZooKeeper) #### 一、环境准备 1. **Hadoop基础环境** HBase伪分布式依赖HDFS存储数据,需先部署Hadoop伪分布式环境并启动HDFS服务[^2]。 验证Hadoop状态: ```bash start-dfs.sh # 启动HDFS jps # 确认NameNode、DataNode进程存在 ``` 2. **安装HBase** 下载HBase二进制包(如`hbase-2.5.8-bin.tar.gz`),解压并配置环境变量: ```bash tar -zxvf hbase-2.5.8-bin.tar.gz -C /usr/local mv /usr/local/hbase-2.5.8 /usr/local/hbase ``` 编辑`~/.bashrc`添加: ```bash export HBASE_HOME=/usr/local/hbase export PATH=$PATH:$HBASE_HOME/bin source ~/.bashrc # 使配置生效[^4] ``` --- #### 二、关键配置修改 1. **配置`hbase-site.xml`** 修改`$HBASE_HOME/conf/hbase-site.xml`,核心参数如下: ```xml <configuration> <!-- 指定HBase数据存储到HDFS --> <property> <name>hbase.rootdir</name> <value>hdfs://localhost:9000/hbase</value> </property> <!-- 启用分布式模式 --> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <!-- 指定内置ZooKeeper数据存储路径 --> <property> <name>hbase.zookeeper.property.dataDir</name> <value>/usr/local/hbase/zookeeper_data</value> </property>[^1] </configuration> ``` 2. **配置`hbase-env.sh`** 确保使用内置ZooKeeper(默认配置,无需修改): ```bash export HBASE_MANAGES_ZK=true # 使用内置ZooKeeper[^3] ``` --- #### 三、启动与验证 1. **启动顺序** ```bash start-dfs.sh # 先启动HDFS start-hbase.sh # 再启动HBase jps # 应包含HMaster、HRegionServer、QuorumPeerMain(内置ZooKeeper进程)[^4] ``` 2. **验证服务** - **通过HBase Shell访问**: ```bash hbase shell status # 输出应显示1个活跃的HMaster ``` - **Web UI检查**: 访问 `http://localhost:16010`,确认集群状态正常。 --- #### 四、注意事项 1. **权限问题** HBase需有权限读写HDFS路径`/hbase`,可通过HDFS命令授权: ```bash hdfs dfs -chmod -R 777 /hbase ``` 2. **端口冲突** 内置ZooKeeper默认使用端口`2181`,若冲突可修改`hbase-site.xml`中`hbase.zookeeper.property.clientPort`参数。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值