
Hbase
ITBOY_ITBOX
技术人生,管理天涯
展开
-
HBase简介
什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hbase.apache.org -- 2006年Google发表BigTable白皮书 -- 2006年开始开发HBase -- 2008年北京成功开奥运会,程序员默默地将HBase弄成了Hadoop...原创 2019-04-07 21:15:04 · 170 阅读 · 0 评论 -
HBase与Hive的对比
1.Hive (1) 数据仓库 Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。 (2) 用于数据分析、清洗 Hive适用于离线的数据分析和清洗,延迟较高。 (3) 基于HDFS、MapReduce Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。 2.HBase (...原创 2019-05-01 11:26:24 · 520 阅读 · 0 评论 -
HBase优化
1.1 高可用 在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。 1.关闭HBase集群(如果没有开启则跳过此步) [atguigu@hadoop102 hbase]$ bin/st...原创 2019-05-01 11:24:14 · 129 阅读 · 0 评论 -
HBase API操作
1.1 环境准备 新建项目后在pom.xml中添加依赖: <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifactId> <version>1.3.1<...原创 2019-05-01 11:22:16 · 426 阅读 · 0 评论 -
HBase数据结构
1.1 RowKey 与nosql数据库们一样,RowKey是用来检索记录的主键。访问HBASE table中的行,只有三种方式: 1.通过单个RowKey访问(get) 2.通过RowKey的range(正则)(like) 3.全表扫描(scan) RowKey行键 (RowKey)可以是任意字符串(最大长度是64KB,实际应用中长度一般为 10-100bytes),在HBASE内部,...原创 2019-05-01 11:16:48 · 571 阅读 · 0 评论 -
HBase Shell操作
基本操作 1.进入HBase客户端命令行 [atguigu@hadoop102 hbase]$ bin/hbase shell 2.查看帮助命令 hbase(main):001:0> help 3.查看当前数据库中有哪些表 hbase(main):002:0> list 表的操作 1.创建表 hbase(main):002:0> create 'stud...原创 2019-05-01 11:05:32 · 363 阅读 · 0 评论 -
HBase安装
1.Zookeeper正常部署 首先保证Zookeeper集群的正常部署,并启动之: [atguigu@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop104 zookeeper-3.4....原创 2019-05-01 10:57:15 · 218 阅读 · 0 评论 -
HBase安装
注:服务器的时间必须要做同步,否则hbase集群可能会启动失败 Zookeeper正常部署 首先保证Zookeeper集群的正常部署,并启动之: [atguigu@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh sta...原创 2019-04-09 13:13:33 · 178 阅读 · 0 评论 -
Hbase工具类
package com.hbase.test.util; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.*; import org.apache.hadoop.hbase.client.*; import org.apache.hadoop.hbase.util.Bytes; impor...原创 2019-04-08 18:09:29 · 183 阅读 · 0 评论 -
HBase架构
从图中可以看出Hbase是由Client、Zookeeper、Master、HRegionServer、HDFS等几个组件组成,下面来介绍一下几个组件的相关功能: 1)Client Client包含了访问Hbase的接口,另外Client还维护了对应的cache来加速Hbase的访问,比如cache的.META.元数据的信息。 2)Zookeeper HBase通过Zookeeper来...原创 2019-04-07 21:19:13 · 292 阅读 · 0 评论 -
Hbase特点
1)海量存储 Hbase适合存储PB级别的海量数据,在PB级别的数据以及采用廉价PC存储的情况下,能在几十到百毫秒内返回数据。这与Hbase的极易扩展性息息相关。正式因为Hbase良好的扩展性,才为海量数据的存储提供了便利。 2)列式存储 这里的列式存储其实说的是列族(ColumnFamily)存储,Hbase是根据列族来存储数据的。列族下面可以有非常多的列,列族在创建表的时候就必须指定。 ...原创 2019-04-07 21:15:37 · 226 阅读 · 0 评论 -
Hbase与Hive的集成
尖叫提示:HBase与Hive的集成在最新的两个版本中无法兼容。所以,我们只能含着泪勇敢的重新编译:hive-hbase-handler-1.2.2.jar!!好气!! 环境准备 因为我们后续可能会在操作Hive的同时对HBase也会产生影响,所以Hive需要持有操作HBase的Jar,那么接下来拷贝Hive所依赖的Jar包(或者使用软连接的形式)。 export HBASE_HOM...原创 2019-05-01 11:29:44 · 201 阅读 · 0 评论