
hbase
文章平均质量分 94
hxpjava1
毕业于武汉理工大学计算机系,12年开发架构经验,擅长java,k8s
展开
-
hbase大规模数据写入的优化历程
业务背景:由于需要将ngix日志过滤出来的1亿+条用户行为记录存入Hbase数据库,以此根据一定的条件来提供近实时查询,比如根据用户id及一定的时间段等条件来过滤符合要求的若干行为记录,满足这一场景的技术包括:Solr,Elasticsearch,hbase等,在此选用了Hbase来实践。step 1 :直接hbase建表,然后读取记录文件逐条写入Hbase。由于hbase实际的写转载 2017-01-24 14:57:47 · 2074 阅读 · 0 评论 -
写了一个简单的hbase连接池
public class HBaseConnectionPool { protected static ConcurrentHashMap idelConnections=null; protected static ConcurrentHashMap activeConnections=null; protected static int initSize; protected st原创 2017-02-16 11:09:05 · 3954 阅读 · 2 评论 -
HBASE API高级特性
一、过滤器 HBASE过滤器用来过滤数据,减少传输到客户端的网络消耗,也可以为客户端减轻一些数据处理压力。过滤器主要分为:比较过滤器,专用过滤器,附加过滤器和自定义过滤器。 1.比较过滤器比较过滤器基于某些运算做出过滤判定。过滤器的两个基本要素是:比较器和运算符。运算符有:等于、不等于,小于,小于等于,大于,大于等于,NO_OP等。比较器为键或值得比较提供比转载 2017-02-14 15:10:24 · 419 阅读 · 0 评论 -
HBase学习笔记-统计表行数
HBase统计表行数的方式如下:一、HBase自带MapReduce表行数统计RowCounter$HBASE_HOME/bin/hbase org.apache.Hadoop.hbase.mapreduce.RowCounter ‘tableName’二、使用Scan与Filter的方式对表行数进行统计[java] view转载 2017-02-14 12:39:07 · 1945 阅读 · 0 评论 -
HBase Block Cache的重要实现细节和In-Memory Cache的特点
每load一个block到cache时,都会检查当前cache的size是否已经超过了“警戒线”,这个“警戒线”是一个规定的当前block cache总体积占额定体积的安全比例,默认该值是0.85,即当加载了一个block到cache后总大小超过了既定的85%就开始触发异步的evict操作了。evict的逻辑是这样的:遍历cache中的所有block,根据它们所属的级别(single,mu转载 2017-02-10 15:56:45 · 894 阅读 · 0 评论 -
用Java访问带有Kerberos认证的HBase
开始之前 因为HBase的存储系统是基于Hadoop的存储,现在Hadoop已经增加了Kerberos认证机制,这样HBase的客户端访问HBase数据库的时候也需要进行身份的认证。 Kerberos是一个认证中心,客户端在访问HBase前必须通过认证才能访问,下图是Kerberos的认证图: 我们不需要详细介绍Kerberos的原理,但是大概流程可转载 2017-02-17 16:32:39 · 1255 阅读 · 0 评论 -
hbase 1.2 api 工具类
hbase之前版本有些api已经deprecated了,下面是1.2的api,没有deprecatedimport java.io.IOException;import java.util.ArrayList;import java.util.List;import java.util.concurrent.ExecutorService;import java.util.concu原创 2017-01-20 12:47:31 · 1615 阅读 · 2 评论 -
hbase命令
下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下:名称命令表达式创建表create '表名称', '列名称1','列名称2','列名称N'添加记录 put '表名称', '行名称', '列名称:', '值'查看记录转载 2014-02-10 13:21:39 · 816 阅读 · 0 评论 -
hbase java api操作
HBase提供了对HBase进行一系列的管理涉及到对表的管理、数据的操作java api。常用的API操作有: 1、 对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。 2、 插入数据 创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等转载 2014-02-10 13:35:38 · 4141 阅读 · 0 评论 -
hbase 安装
一、安装zookeeper在安装好分布式hadoop的环境下,继续安装zookeeper-3.4.5。$ wget http://124.202.164.9/download/32878722/41763290/4/gz/165/152/1353566847397_152/zookeeper-3.4.5.tar.gz $ tar -xf zookeeper-3.4转载 2014-02-10 16:55:56 · 2443 阅读 · 0 评论 -
RHbase 命令
rhbase的相关函数:hb.compact.table hb.describe.table hb.insert hb.regions.tablehb.defaults hb.get hb.insert.data.frame hb.scanhb.delete hb.get.转载 2014-02-15 16:03:43 · 1652 阅读 · 0 评论 -
HBase client api例子集合-1
import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.client.Delete;import原创 2014-02-24 12:14:58 · 2929 阅读 · 0 评论 -
hbase client api 例子-2
package example;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apache.hadoop.hbase.HTabl原创 2014-02-25 15:19:18 · 1408 阅读 · 0 评论 -
HBase rest 和thrift java例子
package example2;import org.apache.hadoop.hbase.client.Get;import org.apache.hadoop.hbase.client.Result;import org.apache.hadoop.hbase.rest.client.Client;import org.apache.hadoop.hbase.rest.clien原创 2014-02-26 15:27:44 · 5344 阅读 · 0 评论 -
java客户端操作Hbase
java客户端操作Hbase 首先,配置好 hadoop+hbase 环境后,确保 hbase 正常启动。1. 搭建开发环境 1.1、运行 Eclipse,创建一个新的 Java工程“ HBaseHelloWorld”,右键项目根目录,选择 “ Properties”->“Java Build Path”->“Library”->“Add Ext转载 2017-01-19 16:42:03 · 614 阅读 · 0 评论 -
Hbase之批量数据写入
/** * Created by similarface on 16/8/16. */ import java.io.IOException; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;转载 2017-01-20 12:39:56 · 4965 阅读 · 1 评论 -
hbase所谓的三维有序存储
hbase所谓的三维有序存储的三维是指:rowkey(行主键),column key(columnFamily+qualifier),timestamp(时间戳)三部分组成的三维有序存储。1.rowkey,我们知道rowkey是行的主键,而且hbase只能用个rowkey,或者一个rowkey范围即scan来查找数据。所以 rowkey的设计是至关重要的,关系到你应用层的查询效率。我们知道转载 2017-01-20 13:41:20 · 961 阅读 · 0 评论 -
HBase 常用Shell命令
进入hbase shell console$HBASE_HOME/bin/hbase shell如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户hbase(main)>whoami表的转载 2017-01-24 09:51:21 · 357 阅读 · 0 评论 -
SpringBoot --集成HBASE/基于SpringDataHadoop
前置工作Hadoop安装配置 : hadoop-2.7.3Hbase安装配置: hbase-1.2.4zookeeper安装配置: zookeeper-3.4.9hbase-client中guava版本与SpringDataHadoop(2.4.0.RELEASE)版本中的guava版本问题Springboot的其他章节,需要了解Hostname 绑定hadoop home问题,配置H转载 2017-09-28 20:13:08 · 4115 阅读 · 0 评论