
hbase
文章平均质量分 83
codemosi
hadoop hive hbase mahout storm spark kafka flume,等连载中,做个爱分享的人。
干一件事,干好一件事!
QQ :1606588828
展开
-
05分布式NOSQL HBASE - Coprocessor协调器
(原文地址:http://blog.youkuaiyun.com/codemosi/article/category/2777041,转载麻烦带上原文地址。hadoop hive hbase mahout storm spark kafka flume,等连载中,做个爱分享的人)1 那么问题又来了 ????1:如果要对HBase的User表,做一些sum,orderby等常用的聚合怎原创 2014-12-15 15:32:45 · 874 阅读 · 0 评论 -
hbase 0.98.1集群安装 (转载)
本文将基于hbase 0.98.1讲解其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.youkuaiyun.com/bluishglc/article/details/24593597,转载请注明出处!1. 安装与配置1.1. 前置条件确保已经安装了hadoop并保证hadoop运行正常。关于hbase与hadoop的转载 2014-12-19 11:30:47 · 495 阅读 · 0 评论 -
01分布式NOSQL HBASE HBase 概述和数据模型
Hbase 是在hadoop上的一个分布式的NOSQL数据库。Row KeyTimestampColumn Family 1 r1t3url=http://title=原创 2014-12-15 10:15:37 · 585 阅读 · 0 评论 -
02分布式NOSQL HBASE - JAVA API 操作HBase
HBase,可以使用shell界面管理数据,也提供java api 来操作Hbase上的表的数据。所有Column均以二进制格式存储,所以在api中要不断的类型转换。 //1 准备HBase上下文 HBaseAdmin 和user表对象hTable Configuration conf = HBaseConfiguration.create(); conf.se原创 2014-12-15 10:17:07 · 782 阅读 · 0 评论 -
03分布式NOSQL HBASE - mapreduce批量读取HBase的数据
1 那么问题来了 ????1:如果有一大票数据比如1000万条,或者批量的插入HBase的表中,HBase提供的java API 中的PUT方法,一条接一条记录的插入方式效率上就非常慢。2:如果要取出HBase一个表里的1000万条数据。用GET一条一条的来,效率也是可想而知,scan的方法批量取出1000万条记录没什么问题,但问题是这个api是在单机上运行的,取庞大的数据效原创 2014-12-15 10:18:08 · 819 阅读 · 0 评论 -
性能测试:SequoiaDB vs. MongoDB vs. Cassandra vs. HBase
在本篇测试报告中,我们使用Yahoo!发布的标准YCSB测试规则,对MongoDB、SequoiaDB、Cassandra、HBase进行对比,并尝试给出每种不同产品所适用的应用场景。在测试配置中,我们尽可能对全部产品做到高可用配置,而在一致性级别上则使用最终一致性。在测试中我们会对两种类型的NoSQL数据库做横向对比,包括Document-Oriented文档类数据库、以及Big-Tab转载 2015-03-11 17:32:38 · 1760 阅读 · 0 评论 -
Hbase shell 常用命令
下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下:名称命令表达式创建表create '表名称', '列名称1','列名称2','列名称N'添加记录 put '表名称', '行名称', '列名称:', '值'查看记录转载 2015-05-13 20:43:08 · 370 阅读 · 0 评论 -
HBase 列的详细解析
import java.io.IOException;import java.util.List; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.Cell;import org.apache.hadoop.hbase.CellUtil;import org.apache.原创 2015-05-14 20:26:16 · 717 阅读 · 0 评论 -
转载
因官方BookPerformanceTuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。配置优化zookeeper.session.timeout默认值:3分钟(180000ms)说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServ转载 2015-09-28 14:36:29 · 394 阅读 · 0 评论