
hbase
卡奥斯道
技术时代的你,愿为技术付出
展开
-
HBase数据导出到HDFS
一、目的把hbase中某张表的数据导出到hdfs上一份。实现方式这里介绍两种:一种是自己写mr程序来完成,一种是使用hbase提供的类来完成。二、自定义mr程序将hbase数据导出到hdfs上2.1首先看看hbase中t1表中的数据:2.2mr的代码如下:比较重要的语句是job.setNumReduceTasks(0);//为什么要设转载 2017-10-08 21:49:28 · 2640 阅读 · 2 评论 -
自定义MapReduce导入HDFS数据到HBase
1.使用Map+Reduce方式public class MapReduceImport { /** * Mapper */ static class HMapper extends MapperLongWritable, Text, LongWritable, Text> { Text v2 = new Text();转载 2017-10-08 22:16:07 · 366 阅读 · 0 评论 -
Spark上通过BulkLoad快速将海量数据导入到Hbase
转:https://www.iteblog.com/archives/1891.html我们在《通过BulkLoad快速将海量数据导入到Hbase[Hadoop篇]》文中介绍了一种快速将海量数据导入Hbase的一种方法,而本文将介绍如何在Spark上使用Scala编写快速导入数据到Hbase中的方法。这里将介绍两种方式:第一种使用Put普通的方法来倒数;第二种使用Bulk Load转载 2017-10-15 15:43:24 · 1304 阅读 · 0 评论 -
读取hive文件并将数据导入hbase
转:http://www.cnblogs.com/zhanggl/p/5658517.htmlpackage cn.tansun.bd.hbase;import java.io.IOException;import java.net.URI;import java.util.List;import java.util.Map;import org.apache.hado原创 2017-10-15 17:41:13 · 1338 阅读 · 0 评论 -
使用Hive来访问HBase
启动hive,进入hive的终端hive --auxpath /opt/hive/lib/hive-hbase-handler-2.1.0.jar,/opt/hive/lib/zookeeper-3.4.6.jar --hiveconf hbase.master=hadoop01:16010 --hiveconf hbase.zookeeper.quorum=hadoop01,hadoop02原创 2017-10-15 17:46:47 · 1383 阅读 · 0 评论 -
HBase和Phoenix的整合
安装Phoenix约定安装到/opt目录下面解压:soft]# tar -zxvf phoenix-4.7.0-HBase-1.1-bin.tar.gz -C ../重命名 opt]# mv phoenix-4.7.0-HBase-1.1 phoenix拷贝lib目录下面jar包到regionserver机器的lib($HBASE_HOME/lib)目录phoenix]#原创 2017-10-15 17:48:58 · 2102 阅读 · 0 评论 -
hbase行健设计原则
行健的设计问题行健的热点问题是由于行健相似、连续且数据量过大操作成单region的数据量过大,进而影响读写效率行健应该尽量的随机、不要出现连续行健。常见的行健设计就是,比如手机号码倒置+时间戳,比如随机前缀+关系型数据库中的主键(以存放在mr中电信日志案例为例)因为hbase提供的查询内容非常非常low,但是所有关于hbase的查询只能通过rowkey,所以在设计行原创 2017-10-15 17:51:53 · 2917 阅读 · 0 评论