
大数据—HBase
mt0803
玩大数据的一个码农
展开
-
编写MapReduce程序访问HBase 遇到的问题与解决方法
根据工作需求,需要测试 MapReduce 程序访问HBase 的性能。由于本人面对MapReduce,HBase都是新手,所以在这个过程中遇到了很多问题,主要如下 :MapReduce 程序如何引用第三方 jar 包MapReduce 访问HBase 的安全认证问题 (kerberos)Hadoop HBase 的conf文件的设定问题原创 2013-08-14 19:05:20 · 2790 阅读 · 0 评论 -
HBase Replication 流程介绍 与 可靠性测试
1. Replication 大致流程原创 2014-09-10 18:12:52 · 2511 阅读 · 0 评论 -
HBase compact 总结 及 调优配置
1 Compaction介绍在HBase中,每当memstore的数据flush到磁盘后,就形成一个storefile,当storefile的数量越来越大时,会严重影响HBase的读性能 ,所以必须将过多的storefile文件进行合并操作。Compaction是Buffer-flush-merge的LSM-Tree模型的关键操作,主要起到如下几个作用:(1)合并文件(2)清除删除、过原创 2013-07-18 19:24:42 · 21189 阅读 · 3 评论 -
Phoenix Secondary Index
1. Phoenix 二级索引原创 2014-08-12 11:57:16 · 3068 阅读 · 0 评论 -
HBase 压力测试
测试环境:3台RegionServer,每台的配置如下:cpu: 32 coremem: 48 GB,每台RS分配16GBRSRPC Handler: 300原创 2014-09-05 15:54:55 · 2449 阅读 · 0 评论 -
HBase Capacity Planning
1. Physical data sizeGanglia监控disk存储状态2. JVM GC Lmitations考虑到GC问题,RS的maxheap size一般推荐设置为16GB左右3. Region count & size估算region数量的Formula:(RS memory)*(totalmemstore fraction)/((memstore siz原创 2014-07-30 18:46:06 · 804 阅读 · 0 评论 -
华为HBase 二级索引调研
1.Overall Solution解决思想:一个user table对应一个index tableindex的创建与更新全部在RS端的cp-processor里实现核心思想:一个actual region对应一个index region一对一的mapping,且两者必须在同一个RS上执行balance,split操作后,受影响的actu原创 2013-11-04 18:53:44 · 2185 阅读 · 1 评论 -
HBase Snapshot简介
在HBase Snapshot出现之前,备份或者克隆table必须使用 Copy/Export Table工具,或者是 disable table,然后拷贝所有的HFiles。前者起MapReduce作业对RegionServer的压力太大,后者需要disable掉table,这就阻塞了读写。 而Snapshot就可以允许admin在没有数据copy和对RS影响很小的情况下cl翻译 2013-10-11 19:11:48 · 1548 阅读 · 0 评论 -
HBase Zookeeper 机器磁盘老是打满的故障分析与解决办法
最近连续两次发现凌晨5点的时候,zk机器磁盘打满导致zk进程挂掉,从而造成hbase集群不可用的事故。 通过分析发现,zk进程一直在写log到文件log.31001e217b, 写这个文件主要是zk将保存的状态信息的操作日志写入到文件中持久化,通过如下的命令查看该日志文件可以发现是什么运用在不停地更新zk中的状态:export ZOOKEEPER_CLASSPATH=/usr/local/hadoo原创 2015-05-15 16:00:08 · 2072 阅读 · 0 评论