
分布式&实时计算
fxly0401
这个作者很懒,什么都没留下…
展开
-
Storm:最火的流式处理框架
原文链接:http://tech.uc.cn/?p=2159 诞 生 在2011年Storm开源之前,由于Hadoop的火红,整个业界都在喋喋不休地谈论大数据。Hadoop的高吞吐,海量数据处理的能力使得人们可以方便地处理海量数据。但是,Hadoop的缺点也和它的优点同样鲜明——延迟大,响应缓慢,运维复杂。 有需求也就有创造,在Hadoop基本奠定了大数据霸主地位转载 2014-01-29 14:10:20 · 730 阅读 · 0 评论 -
Spark:一个高效的分布式计算系统
原文链接:http://tech.uc.cn/?p=2116 概述 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而转载 2014-01-29 14:31:39 · 843 阅读 · 0 评论