
Cloud Computing
文章平均质量分 77
autofei
这个作者很懒,什么都没留下…
展开
-
Apache Hadoop 项目介绍
云计算是目前已经成为主流,那么毫无疑问Hadoop是目前用的最广泛的开源云计算开发包了,而且很多其它的项目现在都移植到了Hadoop上面。原创 2010-08-11 05:42:00 · 2654 阅读 · 0 评论 -
Cloudera’s Distribution for Apache Hadoop
很不错的一个增强版本,A 100% Apache licensed, free, stable distribution offering RPM, Debian, AWS and automatic configuration options。而且还有Ubuntu虚拟机,直接就开始编码了。原创 2011-02-10 08:45:00 · 2246 阅读 · 0 评论 -
Hadoop书籍介绍
市面上关于Hadoop的书籍其实并不多,好像都是外国人的,所以基本上都要看英文的,我就介绍一下我看过的和正在看的吧。原创 2011-03-30 02:34:00 · 9030 阅读 · 1 评论 -
Hadoop的生态系统
一张很有意思的图片,通过它你可以从开发人员角度大致了解现在的云计算转载 2011-03-30 02:06:00 · 303 阅读 · 1 评论 -
实时数据分析Real-time data analysis frameworks (or stream system)
最近的工作中涉及要设计一个系统可以实时的监控系统的状态,比如hadoop任务的执行情况,服务器的健康等。这个系统需要实时的处理对象产生的信息,并发送给用户。这个系统显然需要具备如下特性:可靠性大数据处理实时性显然这将是一个基于Hadoop上的项目,目前可供参考的有Kafka: Kafka is a messaging system that was originally原创 2011-12-17 01:41:19 · 3296 阅读 · 0 评论 -
Apache Hadoop 0.23 介绍
Hadoop 1.0 (0.20.2×) 终于在27 December, 2011正式发布了【1】。下面是一个Hadoop的简单历史【2】:这个也是目前最稳定的版本。新的版本也在开发之中,那就是0.23或者2.0吧!在新版本中引入了很多新的特性,其中着重说一个:HDFS FederationNextGen MapReduceHDFS Federation目前的H原创 2012-01-13 05:50:00 · 4107 阅读 · 2 评论 -
Hadoop套装软件包
如果你在使用Hadoop的同时,还想使用HBase,Hive等,一个个的安装实在是费时费力。一个打包的套装就解决了这个问题。下面介绍几个市面上最重量级公司的产品。建议下载虚拟机版本进行测试或者评估。Cloudera’s Distribution Including Apache Hadoop (CDH)CDH3 Update 3 PackagingTo view t原创 2012-03-21 08:08:54 · 4539 阅读 · 0 评论 -
关于Hadoop中reducer端combiner的一些思考
什么是Combiner Functions“Many MapReduce jobs are limited by the bandwidth available on the cluster, so it pays to minimize the data transferred between map and reduce tasks. Hadoop allows the user to原创 2012-05-23 00:11:18 · 5236 阅读 · 0 评论