大数据学习15:Hbase进阶(使用Java操作HBase,搭建HBase全分布)

本文深入探讨HBase的全分布模式,讲解如何在bigdata112、bigdata113、bigdata114节点上配置。同时,分析HBase在Zookeeper中的数据存储,讨论高可用性。通过Java API,实践HBase的数据操作,了解Region分裂过程。并利用过滤器实现复杂查询,以员工表为例。最后,结合MapReduce处理HBase数据,以WordCount为例,展示`put`命令的用法。

3、全分布模式:bigdata112 bigdata113 bigdata114

	修改文件:hbase-env.sh
		export JAVA_HOME=/root/training/jdk1.8.0_144
		HBASE_MANAGES_ZK	true  ---> 使用HBase自带的ZK

	核心配置文件:  conf/hbase-site.xml
	
		<!--HBase的数据保存在HDFS对应目录-->
		<property>
		  <name>hbase.rootdir</name>
		  <value>hdfs://192.168.157.112:9000/hbase</value>
		</property>	

		<!--是否是分布式环境-->
		<property>
		  <name>hbase.cluster.distributed</name>
		  <value>true</value>
		</property>			

		<!--配置ZK的地址-->
		<property>
		  <name>hbase.zookeeper.quorum</name>
		  <value>192.168.157.112</value>
		</property>				

		<!--冗余度-->
		<property>
		  <name>dfs.replication</name>
		  <value>2</value>
		</property>	

		<!--主节点和从节点允许的最大时间误差-->
		<property>
		  <name>hbase.master.maxclockskew</name>
		  <value>180000</value>
		</property>	
		
	文件regionservers:配置从节点地址
	vi regionservers
		192.168.157.113
		192.168.157.114
		
	复制到其他节点上
		scp -r hbase-1.3.1/ root@bigdata113:/root/training
		scp -r hbase-1.3.1/ root@bigdata114:/root/training

四、HBase在ZK中保存的数据和HA
1、HBase在ZK中保存的数据

2、在bigdata113再手动启动一个HMaster
	hbase-daemon.sh start master

五、操作HBase

1、命令行
	创建表: create 'student','info','grade'
	插入数据: put 'student','stu001','info:name','Tom'
	          put 'student','stu001','info:age','24'
			  put 'student','stu001','info:gender','Male'
			  put 'student','stu001','grade:math','80'
			  put 'student','stu002','info:name','Mike'
	查询:scan 'student'
	      get格式: get '表名','行键'
		           get 'student','stu001' 
				   
	删除表:disable 'student'
	        drop 'student'
2、Java API

3、Web Console: 端口 16010

六、数据保存的过程(重要:一定要注意Region分裂)

七、HBase的过滤器(Java程序):实现复杂的查询,类似where条件
准备测试数据:emp表 员工表

1、列值过滤器
2、列名前缀过滤器
3、多个列名前缀过滤器
4、Rowkey过滤器
5、在查询的时候,可以组合多个过滤器

八、HBase上的MapReduce
测试数据:WordCount
create ‘word’,‘content’
put ‘word’,‘1’,‘content:info’,‘I love Beijing’
put ‘word’,‘2’,‘content:info’,‘I love China’
put ‘word’,‘3’,‘content:info’,‘Beijing is the capital of China’

结果: create 'result','content'

设置环境变量
export HADOOP_CLASSPATH=$HBASE_HOME/lib/*:$CLASSPATH
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值