hadoop
goodhappy8
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Partitioner, SortComparator and GroupingComparator in Hadoop
来源:http://roserouge.iteye.com/blog/746391 hadoop 0.20.2 api里面,作业被重新定义到了类 org.apache.hadoop.mapreduce.Job。它有3个特别的方法:job.setPartitionerClass(Partitioner p);job.setSortComparatorClass(RawCompa...2012-06-20 10:07:00 · 95 阅读 · 0 评论 -
深入理解Bloom Filter
文章转自:http://blog.youkuaiyun.com/liuben/article/details/6602683 Bloom Filter是1970年由Bloom提出的,最初广泛用于拼写检查和数据库系统中。近年来,随着计算机和互联网技术的发展,数据集的不断扩张使得 Bloom filter获得了新生,各种新的应用和变种不断涌现。Bloom filter是一个空间效率很高的数据结构,...2012-12-05 16:01:00 · 148 阅读 · 0 评论 -
(转)HBase技术介绍
来源:http://www.searchtb.com/2011/01/understanding-hbase.html HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现...2012-07-27 10:19:00 · 113 阅读 · 0 评论 -
(转)HBase 官方文档__中文版
来源:http://www.yankay.com/wp-content/hbase/book.html HBase官方文档Copyright © 2010 Apache Software Foundation,盛大游戏-数据仓库团队-颜开(译)Revision HistoryRevision 0.90.4 配置,数据模型使用入门...2012-07-27 09:36:00 · 221 阅读 · 0 评论 -
ZooKeeper Installation
来源:https://ccp.cloudera.com/display/CDHDOC/ZooKeeper+Installation#ZooKeeperInstallation-InstallingtheZooKeeperServerPackage ContentsUpgrading ZooKeeper to the Latest CDH3 ReleasePerfo...2012-07-26 17:36:00 · 169 阅读 · 0 评论 -
(转)HBase Installation
来源:https://ccp.cloudera.com/display/CDHDOC/HBase+Installation ContentsUpgrading HBase to the Latest CDH3 ReleaseStep 1: Perform a Graceful Cluster ShutdownStep 2. Stop the ZooKeeper...2012-07-25 14:51:00 · 161 阅读 · 0 评论 -
CDH3 Installation Guide
来源:https://ccp.cloudera.com/display/CDHDOC/CDH3+Installation+Guide About this Guide ThisCDH3 Installation Guideis for Apache Hadoop developers and system administrators interested in Ha...2012-07-25 10:55:00 · 117 阅读 · 0 评论 -
(转)Zookeeper全解析——Paxos作为灵魂
来源:http://www.spnguru.com/2010/08/zookeeper%E5%85%A8%E8%A7%A3%E6%9E%90%E2%80%94%E2%80%94paxos%E7%9A%84%E7%81%B5%E9%AD%82/ Zookeeper全解析——Paxos作为灵魂原计划在介绍完ZK Client之后就着手ZK Server的介绍,但是发现ZK Serve...2012-07-24 17:06:00 · 100 阅读 · 0 评论 -
(转)HBase技术介绍
来源:http://www.searchtb.com/2011/01/understanding-hbase.html HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似...2012-07-24 10:08:00 · 100 阅读 · 0 评论 -
(转)十道海量数据处理面试题与十个方法大总结
海量数据处理:十道面试题与十个海量数据处理方法总结 作者:July、youwang、yanxionglu。 时间:二零一一年三月二十六日 本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.youkuaiyun.com/v_JULY_v。 ------------------------------------------ ...2012-07-08 22:52:00 · 87 阅读 · 0 评论 -
Using Hadoop Distributed Cache
来源:http://www.ashishpaliwal.com/blog/2012/04/using-hadoop-distributed-cache/ Hadoop has a distributed cache mechanism to make available file locally that may be needed by Map/Reduce jobs. This...2012-06-20 10:33:00 · 104 阅读 · 0 评论 -
bloom filter的开源实现程序memcached bloom filter
文章转自:http://www.heyues.com/mc_bloom_filter/ google code 上的介绍IntroductionBloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,被广泛使用于各种海量数据排重的场景中。Mc bloom ...2012-12-05 16:12:00 · 210 阅读 · 0 评论
分享