strom--理论

  为啥需要storm,主要是mapreduce这个东西只有跑完才能给你传出结果。而且数据是你启动那一刻的数据,如果想着边算边传文件,mapreduce表示臣妾做不到。

流式处理具有时效性高,可以逐条处理数据,处理的快延时也低,类似pipe之类。

在storm中一个topology的概念,英文说法就是网络拓扑。也就是说一个网络里面包含了很多个节点,这节点和节点之间室友一个相互的依赖关系和互助数据传递的一个方向性关系。在topology中包含了spouts和bolts这两个,在这里spouts就是一个数据源,后续的节点就是bolts


一张图很清晰明了的说明了这个topology。在这个图看到一个grouping,其实这个grouping就是类似partition,做为key然后去做一个分组这么一个过程,其实就是一个数据分发。

       在看看storm这么厉害能做什么事情:1 传统的六十计算 2 持续计算 3 分布式RPC


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值