
hadoop
yangxiaoying111
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop 2.2.0正式版特性分析
Apache官网的说明: 15 October, 2013: Release 2.2.0 available Apache Hadoop2.2.0 is the GA release of Apache Hadoop 2.x. Users areencouraged to immediately move to 2.2.0 since this release is signif转载 2014-03-06 11:17:44 · 392 阅读 · 0 评论 -
hadoop简介
Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。 对于Hadoop的集群来讲,可以分成两大类角色:Master和Salve。一个HDFS集群转载 2014-03-06 11:16:55 · 386 阅读 · 0 评论 -
Apache Hadoop 2.x的改进概述
Apache Hadoop 2.x的改进概述 Apache Hadoop 2.xconsists of significant improvements over the previous stable release(hadoop-1.x). 相对于Hadoop 1.x的稳定版本,Hadoop 2.x提供了如下重大改进。 Here is a shortoverview转载 2014-03-06 11:18:08 · 481 阅读 · 0 评论 -
spark 概述
Spark:一个高效的分布式计算系统 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS转载 2014-08-19 14:41:52 · 379 阅读 · 0 评论