
HBase
文章平均质量分 82
撸大湿
从事Hadoop、分布式系统、机器学习、人工智能、智能搜索等工作
展开
-
玩转HBase: Coprocessor Endpoint (2):coprocessorProxy和coprocessorExec的合理运用
前言:相比HBase,关系型数据库有两大问题:动态横向扩展和分布式并行计算。架设在HDFS上的HBase,在动态横向扩展方面具有先天的优势。而分布式并行计算则需要MapReduce和Coprocessor-Endpoint来实现。可是玩过Hadoop的童鞋都了解,MapReduce分布式计算框架有一个致命弱点:高延时很多实时的分布式查询和计算业务中,Ma原创 2013-05-12 22:40:08 · 4654 阅读 · 9 评论 -
玩转HBase: Coprocessor Endpoint (1):startkey和endkey的真正作用
前言:早在2004年我注册了优快云账号,当时我才大三(那时我的昵称叫"华裔大魔王-抗日要从娃娃抓起")时光飞逝,一晃九年过去了那时我主要混迹VB和SQL Server版,和大部分初学者一样,我也在论坛上发了许多菜鸟问题邹老大、子陌红尘还有大乌龟等高手成为了我心中的偶像~~随着时间推移,我从提问者转变成了答题方。我花了三年的时间终于拿到自己的第一颗星星~~两年前,由于工作原原创 2013-05-11 20:31:41 · 8401 阅读 · 3 评论 -
HBase MapReduce MultiTableInput首次测试
在HBase上跑MapReduce有个很麻烦的问题:多HTable+多Scan作为Map的Input对象。以往都需要开发人员去写TableInputFormat类的重载方法。HBase 0.94.6版本加入了一个新的Class::MultiTableInputFormatBase。(这里我提醒一下HBase 0.94.6有致命BUG,请用0.94.7)这个方法可以帮助MapReduce开发原创 2013-05-28 21:51:07 · 6279 阅读 · 0 评论