大数据学习----HBase的安装和基础命令
永远谦逊,保持对学习的渴望。
第一章 Linux安装 第二章 Linux配置 第三章 Hadoop完全分布式环境搭建 第四章 Zookeeper的安装 第五章 HBase的安装和基础命令
参考文章:
一、HBase百度百科词条
前言
本文紧接上文,包括HBase安装之前的一些其他的工具的安装,准备和搭建完成后的测试
以下是本篇文章正文内容
一、所需要的资源
资源分享:
所需要用到资源:
hbase-2.2.2-bin.tar.gz
链接: 大数据学习所需资源
提取码:k6wy
二、HBase的安装配置
HBase概要
HBase是Apache软件基金会旗下的一个开源分布式的面向列的数据库,就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。
HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。
(一)下载安装文件
通过链接下载文件,对文件进行解压。一般放在/usr/local目录下面。
解压命令
sudo tar -zxf ~/下载/hbase-2.2.2-bin.tar.gz -C /usr/local
重命名:
sudo mv /usr/local/hbase-2.2.2 /usr/local/hbase
修改所属用户
sudo chown -R hadoop:hadoop hbase/
(二)配置环境变量
打开bashrc 配置文件,追加路径。
export HBASE_HOME=/usr/local/hbase
export PATH=$HBASE_HOME/bin:$PATH
环境变量生效:
source ~/.bashrc
(三)修改HBASE配置文件
1. 修改conf/hbase-env.sh
(1)修改Java路径 查找到Java配置处:
去掉 JAVA_HOME 前的 “#”,并将其修改成自己安装的 Java 路径。
(2)去掉 HBASE_MANAGES_ZK 前的 “#”,并将其值设置为 true(HBase 管理自己的 ZooKeeper,这样就不需要单独安装 ZooKeeper,第四章中已经安装好了Zookeeper)
2. 修改conf/hbase-site.xml
<configuration>
#hbase的根目录,与hadoop配置时的fs.defaultname保持一致
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop101:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>false</value>
</property>
<property>#zookeeper主节点
<name>hbase.Zookeeper.quorum</name>
<value>hadoop101</value>
</property>
<property>#zookeeper连接时间限制
<name>Zookeeper.session.timeout</name>
<value>60000</value>
</property>
<property>
<name>hbase.Zookeeper.property.clientPort</name>
<value>2181</value>
</property>
<property>#临时存储目录,先创建好
<name>hbase.tmp.dir</name>
<value>/home/hadoop/data/hbase/tmp</value>
</property>
<property>
<name>hbase.client.keyvalue.maxsize</name>
<value>10485760</value>
</property>
</configuration>
(四)查看HBase版本信息
hbase verison #测试
三、HBase的分布式环境配置
(一)配置conf/regionservers
Hadoop101为主节点master
hadoop103和Hadoop102为regionservers
(二)配置HBase master的备份节点
vim backup-masters
hadoop101
如果集群变大需要修改备份节点
(三)配置conf/hbase-site.xml
<configuration>
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop101,hadoop102,hadoop103</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/usr/local/zookeeper/zkData</value>
</property>
<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2181</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop101:9000/hbase</value>
</property>#与HDFS core-site.xml主节点端口号保持一致
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.master</name>
<value>hdfs://hadoop101:60000</value>
</property>
</configuration>
复制hadoop目录下的core-site.xml与hdfs.xml到hbase/conf目录下。
(四)配置conf/hbase-env.sh
(1)修改Java路径 查找到Java配置处:
去掉 JAVA_HOME 前的 “#”,并将其修改成自己安装的 Java 路径。
(2)去掉 HBASE_MANAGES_ZK 前的 “#”,并将其值设置为 true(HBase 管理自己的 ZooKeeper,这样就不需要单独安装 ZooKeeper,第四章中已经安装好了Zookeeper)
(五)配置环境变量
打开bashrc 配置文件,追加路径。
export HBASE_HOME=/usr/local/hbase
export PATH=$HBASE_HOME/bin:$PATH
环境变量生效:
source ~/.bashrc
(六)Hbase安装包远程同步到其他节点
scp -r hbase hadoop@hadoop102:/usr/local/
scp -r hbase hadoop@hadoop103:/usr/local/
(七)启动集群
启动Zookeeper
启动HDFS,YARN
启动Hbase
JPS查看进程
网页端口在1.0以后改成16010
四、HBase常用shell命令
(一) 在HBase中创建表
hbase> create 'student','Sname','Ssex','Sage','Sdept',’acourse'
list命令可查看创建了哪些表
(二) 添加数据
hbase> put 'student','95001','Sname','LiYing'
(三) 查看数据
get命令:用于查看表的某一个单元格数据;
scan命令:用于查看某个表的全部数据
(四) 删除数据
delete删除数据
deleteall删除所有数据
(五) 删除表
hbase> disable 'student'
hbase> drop 'student'
(六) 退出HBase数据库
exit命令
总结
这里对文章进行总结:
HBASE安装完成后HMASter在启动后挂掉的解决办法:
1.复制hadoop目录下的core-site.xml与hdfs.xml到hbase/conf目录下。
2.hbase-site.xml的配置hbase.rootdir要与hdfs的core-site.xml保持一致。
努力,奋斗!!!