strom:http://storm.apache.org/index.html
实时计算系统,持续计算,速度快,每秒百万tuble,
tuble:元组 数据结构,使用 逗号分隔,
stream:一系列的tuble
spout:水龙头 数据源
bolt:螺栓,逻辑处理单元,spout数据传给bolt,bolt处理后为新的tuble ,可以filter,MapReduce,group
topology:无环有向图。只能kill-9
tasks:spout和bolt的执行过程就是task,
works:工作节点,storm和worker之间均衡分配任务,监听job ,start stop进程
stream group :控制tuble如何流动。
storm 架构:

nimbus 核心组件, master node,主要运行toplogy 在work node分发数据,监控故障,指派task给worker node
supervisor :有多个处理进程,代理task给所有的work进程,work进程孵化出足够的线程 task 接受nimbus 分发的指令,监督worker进程,完成task







storm 搭建:
sh storm nimbus &
sh storm supervisor &
sh storm ui &
netstat -ano |grep
本文深入探讨了Apache Storm,一种快速、可靠的实时计算系统。Storm能够处理每秒百万级的数据元组(tuble),通过spout接收数据,bolt进行逻辑处理,形成无环有向图的topology结构。介绍了其核心组件nimbus和supervisor的作用,以及搭建流程。
4659

被折叠的 条评论
为什么被折叠?



