
大数据.hbase
ZzzCrazyPig
让优秀成为一种习惯
展开
-
HBase Bulk Loading 实践
HBase Bulk Loading使用实践原创 2015-12-31 08:50:01 · 1776 阅读 · 3 评论 -
Phoenix查询抛InsufficientMemoryException异常
测试集群中使用Phoenix进行数据查询抛出InsufficientMemoryException,这篇文章主要介绍如何解决这个异常。原创 2016-07-01 13:59:54 · 1755 阅读 · 0 评论 -
Lily HBase Indexer在CDH中的基本使用
Lily HBase Indexer是一款灵活的、可扩展的、高容错的、事务性的,并且近实时的处理hbase列索引数据的分布式服务软件。它是NGDATA公司开发的Lily系统的一部分,已开放源代码,源代码托管在github上。原创 2016-05-03 15:12:12 · 3251 阅读 · 2 评论 -
Phoenix 导出csv文件
是否存在高效的导出工具?Phoenix提供了BulkLoad工具来高效导入数据,那么Phoenix是否也存在高效导出数据的工具类呢?这里可能有人会想是否能够按照导出常规hbase的方法来导出数据。是否能这么干取决于你phoenix建表时候字段的数据类型。原创 2016-05-07 18:03:36 · 11178 阅读 · 3 评论 -
Phoenix Salted Table
Phoenix Salted Table是phoenix为了防止hbase表rowkey设计为自增序列而引发热点region读和热点region写而采取的一种表设计手段。通过在创建表的时候指定SALT_BUCKETS来实现pre-split。原创 2016-05-08 14:52:07 · 4175 阅读 · 0 评论 -
HBase Indexer导致Solr与HBase数据不一致问题解决
经过对HBase Indexer一段时间的使用、测试、观察,发现通过Phoenix端导入到HBase表的数据与Solr那边的数据会产生不一致的现象,具体体现为Solr那边的数据会比HBase表数据少几千条或者更多。在公司测试环境以及试点项目生产环境下都会出现这个问题。原创 2016-06-03 16:12:05 · 4711 阅读 · 1 评论 -
Phoenix二级索引
对于HBase而言,如果想精确地定位到某行记录,唯一的办法是通过rowkey来查询。如果不通过rowkey来查找数据,就必须逐行地比较每一列的值,即全表扫瞄。对于较大的表,全表扫描的代价是不可接受的。但是,很多情况下,需要从多个角度查询数据。例如,在定位某个人的时候,可以通过姓名、身份证号、学籍号等不同的角度来查询,要想把这么多角度的数据都放到rowkey中几乎不可能(业原创 2015-12-19 15:43:29 · 7555 阅读 · 9 评论 -
Phoenix4.6适配CDH5.4
在phoenix官网下载的phoenix-4.6.0-HBase-1.0/版本,无法适配cdh5.4的hbase(hbase版本为1.0.0),使用sqlline.py连接hbase时候会报类似以下错误:Caused byjava.lang.NoSuchMethodError: org.apache.hadoop.hbase.client.Scan.setRaw(Z)Lorg/apach原创 2015-12-19 14:37:12 · 4946 阅读 · 3 评论 -
Phoenix4.6 BulkLoad OOM
Phoenix 提供了一个导入海量数据的MapReduce工具 CsvBulkLoadTool,根据官方的说明,使用这个工具可以高效地往hbase导入csv文本数据,内部会使用phoenix api去处理数据,包括数据类型、salt rowkey处理、索引表同步等等。但是使用这个工具类在导入数据量比较大的情况下reducer阶段却发生了OOM...原创 2016-05-06 19:47:08 · 3856 阅读 · 0 评论 -
Phoenix导致HBase集群region offline故障解决
故障描述最近我们的测试HBase集群经常因为机房网络维护而奔溃掉,在集群奔溃以后重启HBase集群发现有大部分region没有online的情况,导致查询表数据的时候会出现如下异常:org.apache.hadoop.hbase.NotServingRegionException:...原创 2016-05-26 17:42:30 · 19695 阅读 · 2 评论 -
Phoenix使用总结
对工作中预研Phoenix的使用做一些总结原创 2015-12-19 16:02:48 · 17704 阅读 · 0 评论 -
深入理解HBase Indexer
HBase Indexer全名为Lily Hbase Indexer,是NGDATA公司为了将lily子系统里面相关HBase数据存储到Solr而开发的一个软件。NGDATA公司将源代码开源并托管在Github上,通过以下Github地址访问Hbase-Indexer项目主页及代码: https://github.com/NGDATA/hbase-indexer原创 2016-05-25 17:51:05 · 11915 阅读 · 3 评论