
分布式计算
wenhuiqiao
这个作者很懒,什么都没留下…
展开
-
Twitter Storm:开源实时Hadoop
Twitter将Storm正式开源了,这是一个分布式的、容错的实时计算系统,它被托管在GitHub上,遵循Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统,BackType现在已在Twitter麾下。GitHub上的最新版本是Storm 0.5.2,基本是用Clojure写的。Storm为分布式实时计算提供了一组通用原语,可被用于“流处转载 2012-09-21 15:52:29 · 770 阅读 · 0 评论 -
storm-trident源码学习
trident代码的阅读有两个重要的类TridentTopology、Stream,这两个类可以作为我们学习storm-trident源代码的入口。trident的拓扑的构造分两部分:一:构造trident逻辑的拓扑,这部分就是我们调用TridentTopology.newStream(......).each().groupBy().....等的过程中实现。这个过程完成一个逻辑拓原创 2013-01-01 22:28:29 · 3591 阅读 · 2 评论 -
TWITTER STORM学习
1. storm的topology是从启动开始一直运行,只要有tuple到来,各个环节就会被出发执行。2. stream是storm的核心概念,一个stream是一个持续的tuple序列,这些tuple被以分布式并行的方式创建和处理。3. spouts是一个stream的源头,spouts负责从外部系统读取数据,并组装成tuple发射出去,tuple被发射后就开始再topology中传播。原创 2013-03-21 16:26:50 · 2645 阅读 · 0 评论