
Hbase
滑过的板砖
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HBase简易安装和简介
HBase简介HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。HBase的目标是存储并处理大型的数据,更具体地说仅用普通的硬件配置,能够处理成千上万的行和列所组成的大型数据库。HBase是一个开源的、分布式的、多版本的、面向列的存储模型。可以直接使用本地文件系统也可使用Hadoop的HDFS文件存储系统。为转载 2015-06-19 10:28:56 · 368 阅读 · 0 评论 -
Hbase总结(六)hbase37个笔试题
以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间1. HBase来源于哪篇博文? CA The Google File SystemB MapReduceC BigTableD Chubby2. 下面对HBase的描述哪些是正确的? B、C、DA 不是开源的B 是面向列的C 是分布式转载 2016-04-22 10:25:33 · 989 阅读 · 0 评论 -
Hbase总结(五)-hbase常识及habse适合什么场景
当我们对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,如果我们使用的传统数据库,肯定留有多余的字段,10个不行,20个,但是这个严重影响了质量。并且如果面对大数据库,pt级别的数据,这种浪费更是严重的,那么我们该使用是什么数据库?hbase数个不错的选择,那么我们对于hbase还存在下列问题:1.Column Family代表什么?转载 2016-04-22 10:18:20 · 322 阅读 · 0 评论 -
HBase总结(七)LSM理解
讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来:哈希存储引擎 是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫描,对应的存储系统为key-value存储系统。对于key-value的插入以及查询,哈希表的复杂度都是O(1),明显比树的操作O(n)快,如果不需要有序的遍历数据,哈希表就是your Mr.RightB树存储引擎是B树(关于B树的由来转载 2016-04-22 10:16:45 · 290 阅读 · 0 评论 -
HBase总结(十九)数据导入方式
*). Client API实现借助HBase的Client API来导入, 是最简易学的方式.Configuration config = HBaseConfiguration.create(); // 配置hbase.zookeeper.quorum: 后接zookeeper集群的机器列表 config.set("hbase.zookeeper.quorum", "tw-nod转载 2016-04-22 10:11:17 · 364 阅读 · 0 评论 -
HBase总结(十八)Hbase rowkey设计一
hbase所谓的三维有序存储的三维是指:rowkey(行主键),column key(columnFamily+qualifier),timestamp(时间戳)三部分组成的三维有序存储。1.rowkey,我们知道rowkey是行的主键,而且hbase只能用个rowkey,或者一个rowkey范围即scan来查找数据。所以 rowkey的设计是至关重要的,关系到你应用层的查询效率。我们知道转载 2016-04-22 10:06:05 · 638 阅读 · 0 评论 -
深入分析HBase Compaction机制
Compaction介绍Compaction是buffer->flush->merge的Log-Structured Merge-Tree模型的关键操作,主要起到如下几个作用:1)合并文件2)清除删除、过期、多余版本的数据3)提高读写数据的效率Minor & Major Compaction的区别1)Minor操作只用来做部分文件的合并操作以及包括m转载 2016-04-22 09:59:03 · 1653 阅读 · 0 评论 -
Region Server宕机,对整个集群的影响有哪些
本文章主要描述Region Server宕机后, 集群的处理过程,以及测试结果.Region Server宕机后,做了一下几步,1.ZK发现并确认RS宕机, 在RS列表中删除宕机的节点,2.Split日志文件HLog,将每一个日志文件分配给对应的Region3.将Region分配给其他活着的Region Server4.Region Server转载 2016-04-22 09:57:24 · 1372 阅读 · 0 评论 -
HBase向多个column写入的性能分析
测试场景:1.向一列中插入每条2K的数据2.向100列中插入每条20byte的数据以上两个场景,HBase写入的性能相差很大.造成这个情况的原因是,HBase存储方式是以KeyValue来存的,每个KeyValue是由key,CF, column,TS等组成的,也就是说,HBase接受到了100列的数据,以column拆分成100个KeyValue,这样就造成了很多转载 2016-04-22 09:55:06 · 1039 阅读 · 0 评论 -
HBase技术介绍
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理转载 2016-04-22 09:51:13 · 323 阅读 · 0 评论 -
HBase宕机的多种场景
异常导致的退出会通过接口Abortable定义的abort()方法实现,Abortable实现类如下: 由以上类图可以看出HBaseAdmin的abort由于是client的访问,因此终止服务只需抛出异常即可,HConnection也是用于client,因此只需关闭连接,如果是zk的异常会在后续的使用中重新连接zk而不用关闭连接,其中重点的是HMaster、HRegionServer和转载 2016-04-22 09:48:29 · 2219 阅读 · 0 评论 -
hbase的coprocessor使用
1.起因(Why HBase Coprocessor)HBase作为列族数据库最经常被人诟病的特性包括:无法轻易建立“二级索引”,难以执行求和、计数、排序等操作。比如,在旧版本的(计数据表的总行数,需要使用Counter方法,执行一次MapReduce Job才能得到。虽然HBase在数据存储层中集成了MapReduce,能够有效用于数据表的分布式计算。然而在很多情况下,做一些简单的转载 2016-04-22 09:47:45 · 574 阅读 · 0 评论 -
HBase总结(二十)HBase常用shell命令详细说明
版权声明:本文为博主原创文章,未经博主允许不得转载。进入hbase shell console$HBASE_HOME/bin/hbase shell如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户hbase(转载 2016-04-21 18:22:09 · 499 阅读 · 0 评论 -
提升HBase写性能
一、调整参数入门级的调优可以从调整参数开始。投入小,回报快。 1. Write Buffer Size快速配置Java代码 HTable htable = new HTable(config, tablename); htable.setWriteBufferSize(6 * 1024 * 1024); htable.转载 2016-04-21 18:20:43 · 407 阅读 · 0 评论 -
HBase数据库性能调优(1)
HBase数据库性能调优(1) 配置优化zookeeper.session.timeout默认值:3分钟(180000ms)说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServer会被Zookeeper从RS集群清单中移除,HMaster收到移除通知后,会对这台server负责的regions重新bal转载 2015-06-18 17:07:57 · 352 阅读 · 0 评论 -
HBase总结(九)Bloom Filter概念和原理
Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom转载 2016-04-22 10:26:53 · 317 阅读 · 0 评论