分布式流处理与虚拟化调度技术解析
1. 分布式流处理系统中的 Squirrel 框架
在分布式流处理场景中,Squirrel 框架是一种网络感知分组框架,用于将元组分配到不同的网络通道。它与传统分组策略不同,在分组元组时会考虑下游任务的位置。通过识别两个通信操作符之间的网络距离,Squirrel 采用权重分组的方式来决定发送到每个网络通道的元组数量。
1.1 性能指标对比
-
处理延迟 :对比了 Squirrel 和原始 Flink 在单词计数(WordCount)和广告拓扑(AdvertisingTopology)任务中的处理延迟(即平均元组执行时间)。结果显示,Squirrel 在单词计数和广告任务中的平均元组执行时间分别为 1.03 毫秒和 1.62 毫秒,而 Flink 分别为 1.91 毫秒和 3.26 毫秒。Squirrel 最多可将平均元组执行时间提高 47%。
| 任务 | Squirrel 平均元组执行时间(ms) | Flink 平均元组执行时间(ms) | 提升比例 |
| ---- | ---- | ---- | ---- |
| 单词计数 | 1.03 | 1.91 | 47% |
| 广告拓扑 | 1.62 | 3.26 | - | -
吞吐量 :在吞吐量方面,Squirrel 在单词计数和广告任务中的平均吞吐量分别为 91624 元组/秒和 127209 元组/秒,而 Flink 分别为 57162 元组/秒和 76173 元组/秒。Squirrel 实现了比 Flink 平均
超级会员免费看
订阅专栏 解锁全文
2835

被折叠的 条评论
为什么被折叠?



