
大数据
文章平均质量分 68
huoyin
这个作者很懒,什么都没留下…
展开
-
HBase VS Cassandra
目前分布式的,可扩展的数据库正被猛烈的需要着,从社会媒体新兴公司需要构建海量数据仓库,到生物公司的蛋白质链分析。“大数据”每一天都变得更重要了。尽管Hadoop目前已经是大数据问题处理方面事实存在的标准。但仍然存在一些其他的分布式数据库,每个都有他们独特的优势。 有两个数据库获得了最多的关注:HBase 和 Cassandra。关于这两个雄心勃勃的项目的分歧可以归纳为特性和架构方面的不同原创 2014-01-22 17:21:58 · 2233 阅读 · 0 评论 -
Zookeeper开发常见问题
背景与目的 Zookeeper开发过程中遇到一些常见问题,为了后续开发不犯同样的错误,总结一下此类问题,并进行分析和解决。 适合人员 主要适合zookeeper开发、测试及运维相关人员。 问题与解决 一、 关于zookeeper_init函数的使用 问题描述: 开发人员在调用zookeeper_init函数时,若返回一个非空句柄zhan转载 2014-04-03 17:26:49 · 1392 阅读 · 0 评论 -
hbase 学习梳理
一、HBASE 简介 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统"。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Ha转载 2015-11-18 23:21:21 · 1375 阅读 · 0 评论 -
解决Cloudera Clock Offset问题
I just saw this after an office move. The servers were offline for a while. This is what I did for our CentOS Linux servers (similar, but not the same, steps would work for Ubuntu/Debian):转载 2016-01-15 17:36:43 · 6006 阅读 · 1 评论 -
HBase Scan查询参数
1)setCacheBlocks对于经常查询值,设置为true,试的Memstore可以缓存该数据。如果是全表扫描,设置为false。2) setCachingScan.setCaching is a misnomer. It should really be called something like Scan.setPrefetch. setCaching actually specifies...原创 2018-02-12 10:50:26 · 2109 阅读 · 0 评论