深入理解Storm拓扑设计与应用
1. Storm核心概念基础
在开始拓扑设计之前,我们需要了解一些Storm的核心概念。主方法可以分为三个部分:
- 构建拓扑 :明确流的位置,并确定每个流的分组方式。
- 创建配置 :例如开启调试日志,还有更多配置选项可按需设置。
- 提交运行 :将配置和构建好的拓扑提交到本地集群运行。
运行 LocalTopologyRunner.java 的主方法,会在控制台看到调试日志,显示元组由spout发出并由bolt处理。以下是一些核心概念总结:
- 拓扑 :是一个图,节点代表单个进程或计算,边代表一个计算的结果作为另一个计算的输入。
- 元组 :是一个有序的值列表,每个值都有一个名称,代表两个组件之间传递的数据。
- 流 :两个组件之间元组的流动。
- Spout :流的源,负责从数据源读取数据并将元组发送到输出流。
- Bolt :拓扑中的核心逻辑所在,执行过滤、聚合、连接等操作,还可与数据库交互。
- 组件实例 :Spout和Bolt以一个或多个实例执行,将元组发送到其他Bolt实例。
- 流分组 :定义元组在组件实例之间的流动方式。
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



