
hbase
文章平均质量分 94
hxpjava1
毕业于武汉理工大学计算机系,12年开发架构经验,擅长java,k8s
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hbase大规模数据写入的优化历程
业务背景:由于需要将ngix日志过滤出来的1亿+条用户行为记录存入Hbase数据库,以此根据一定的条件来提供近实时查询,比如根据用户id及一定的时间段等条件来过滤符合要求的若干行为记录,满足这一场景的技术包括:Solr,Elasticsearch,hbase等,在此选用了Hbase来实践。 step 1 : 直接hbase建表,然后读取记录文件逐条写入Hbase。由于hbase实际的写转载 2017-01-24 14:57:47 · 2084 阅读 · 0 评论 -
写了一个简单的hbase连接池
public class HBaseConnectionPool { protected static ConcurrentHashMap idelConnections=null; protected static ConcurrentHashMap activeConnections=null; protected static int initSize; protected st原创 2017-02-16 11:09:05 · 3970 阅读 · 2 评论 -
HBASE API高级特性
一、过滤器 HBASE过滤器用来过滤数据,减少传输到客户端的网络消耗,也可以为客户端减轻一些数据处理压力。过滤器主要分为:比较过滤器,专用过滤器,附加过滤器和自定义过滤器。 1.比较过滤器 比较过滤器基于某些运算做出过滤判定。过滤器的两个基本要素是:比较器和运算符。运算符有:等于、不等于,小于,小于等于,大于,大于等于,NO_OP等。比较器为键或值得比较提供比转载 2017-02-14 15:10:24 · 431 阅读 · 0 评论 -
HBase学习笔记-统计表行数
HBase统计表行数的方式如下: 一、HBase自带MapReduce表行数统计RowCounter $HBASE_HOME/bin/hbase org.apache.Hadoop.hbase.mapreduce.RowCounter ‘tableName’ 二、使用Scan与Filter的方式对表行数进行统计 [java] view转载 2017-02-14 12:39:07 · 1963 阅读 · 0 评论 -
HBase Block Cache的重要实现细节和In-Memory Cache的特点
每load一个block到cache时,都会检查当前cache的size是否已经超过了“警戒线”,这个“警戒线”是一个规定的当前block cache总体积占额定体积的安全比例,默认该值是0.85,即当加载了一个block到cache后总大小超过了既定的85%就开始触发异步的evict操作了。 evict的逻辑是这样的:遍历cache中的所有block,根据它们所属的级别(single,mu转载 2017-02-10 15:56:45 · 905 阅读 · 0 评论 -
用Java访问带有Kerberos认证的HBase
开始之前 因为HBase的存储系统是基于Hadoop的存储,现在Hadoop已经增加了Kerberos认证机制,这样HBase的客户端访问HBase数据库的时候也需要进行身份的认证。 Kerberos是一个认证中心,客户端在访问HBase前必须通过认证才能访问,下图是Kerberos的认证图: 我们不需要详细介绍Kerberos的原理,但是大概流程可转载 2017-02-17 16:32:39 · 1267 阅读 · 0 评论 -
hbase 1.2 api 工具类
hbase之前版本有些api已经deprecated了,下面是1.2的api,没有deprecated import java.io.IOException; import java.util.ArrayList; import java.util.List; import java.util.concurrent.ExecutorService; import java.util.concu原创 2017-01-20 12:47:31 · 1631 阅读 · 2 评论 -
hbase命令
下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称 命令表达式 创建表 create '表名称', '列名称1','列名称2','列名称N' 添加记录 put '表名称', '行名称', '列名称:', '值' 查看记录转载 2014-02-10 13:21:39 · 833 阅读 · 0 评论 -
hbase java api操作
HBase提供了对HBase进行一系列的管理涉及到对表的管理、数据的操作java api。 常用的API操作有: 1、 对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。 2、 插入数据 创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等转载 2014-02-10 13:35:38 · 4158 阅读 · 0 评论 -
hbase 安装
一、安装zookeeper 在安装好分布式hadoop的环境下,继续安装zookeeper-3.4.5。 $ wget http://124.202.164.9/download/32878722/41763290/4/gz/165/152/1353566847397_152/zookeeper-3.4.5.tar.gz $ tar -xf zookeeper-3.4转载 2014-02-10 16:55:56 · 2456 阅读 · 0 评论 -
RHbase 命令
rhbase的相关函数: hb.compact.table hb.describe.table hb.insert hb.regions.table hb.defaults hb.get hb.insert.data.frame hb.scan hb.delete hb.get.转载 2014-02-15 16:03:43 · 1677 阅读 · 0 评论 -
HBase client api例子集合-1
import java.util.ArrayList; import java.util.List; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.Delete; import原创 2014-02-24 12:14:58 · 2952 阅读 · 0 评论 -
hbase client api 例子-2
package example; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.hadoop.hbase.HTabl原创 2014-02-25 15:19:18 · 1418 阅读 · 0 评论 -
HBase rest 和thrift java例子
package example2; import org.apache.hadoop.hbase.client.Get; import org.apache.hadoop.hbase.client.Result; import org.apache.hadoop.hbase.rest.client.Client; import org.apache.hadoop.hbase.rest.clien原创 2014-02-26 15:27:44 · 5355 阅读 · 0 评论 -
java客户端操作Hbase
java客户端操作Hbase 首先,配置好 hadoop+hbase 环境后,确保 hbase 正常启动。 1. 搭建开发环境 1.1、运行 Eclipse,创建一个新的 Java工程“ HBaseHelloWorld”,右键项目根目录,选择 “ Properties”->“Java Build Path”->“Library”->“Add Ext转载 2017-01-19 16:42:03 · 633 阅读 · 0 评论 -
Hbase之批量数据写入
/** * Created by similarface on 16/8/16. */ import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;转载 2017-01-20 12:39:56 · 4981 阅读 · 1 评论 -
hbase所谓的三维有序存储
hbase所谓的三维有序存储的三维是指:rowkey(行主键),column key(columnFamily+qualifier),timestamp(时间戳)三部分组成的三维有序存储。 1.rowkey,我们知道rowkey是行的主键,而且hbase只能用个rowkey,或者一个rowkey范围即scan来查找数据。所以 rowkey的设计是至关重要的,关系到你应用层的查询效率。我们知道转载 2017-01-20 13:41:20 · 969 阅读 · 0 评论 -
HBase 常用Shell命令
进入hbase shell console $HBASE_HOME/bin/hbase shell 如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户 hbase(main)> whoami 表的转载 2017-01-24 09:51:21 · 365 阅读 · 0 评论 -
SpringBoot --集成HBASE/基于SpringDataHadoop
前置工作 Hadoop安装配置 : hadoop-2.7.3Hbase安装配置: hbase-1.2.4zookeeper安装配置: zookeeper-3.4.9hbase-client中guava版本与SpringDataHadoop(2.4.0.RELEASE)版本中的guava版本问题Springboot的其他章节,需要了解Hostname 绑定hadoop home问题,配置H转载 2017-09-28 20:13:08 · 4129 阅读 · 0 评论