3、分布式流处理与虚拟化平台调度优化

分布式流处理与虚拟化平台调度优化

1. 分布式流处理系统中的 Squirrel 框架

1.1 分组策略

在分布式流处理中,下游任务间的单词重新平衡采用了洗牌分组(shuffle grouping),而通过哈希操作聚合键的归约阶段则使用键分组(key grouping)。

1.2 性能对比

1.2.1 处理延迟

在单词计数(WordCount)和广告拓扑(AdvertisingTopology)任务中,对 Squirrel 和原始的 Flink 进行了处理延迟(即平均元组执行时间)的对比。结果如下表所示:
| 系统 | 单词计数平均元组执行时间(ms) | 广告拓扑平均元组执行时间(ms) |
| ---- | ---- | ---- |
| Squirrel | 1.03 | 1.62 |
| Flink | 1.91 | 3.26 |

实验结果表明,Squirrel 最多可将平均元组执行时间提高 47%。

1.2.2 吞吐量

在单词计数和广告拓扑任务中,Squirrel 和 Flink 的吞吐量对比如下:
| 系统 | 单词计数平均吞吐量(tuples/s) | 广告拓扑平均吞吐量(tuples/s) |
| ---- | ---- | ---- |
| Squirrel | 91624 | 127209 |
| Flink | 57162 | 76173 |

Squirrel 相较于 Flink,平均系统吞吐量实现了 1.67 倍的提升。

1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值