核心要点:
- 谷歌 2020 SIGCOM
- 基于delay的AIMD
- 拥塞拆分EC和FC,时延敏感场景优势
- 分别计算EC和FC的wnd(最核心)
- 保障吞吐和低延迟。Swift 因利用延迟的简单性和有效性而闻名
- 包级别的
- 论文:https://dl.acm.org/doi/pdf/10.1145/3387514.3406591
- 论文翻译版:参考附件
其他:
- Swift 是 Google 提出的一种用于数据中心内通信的基于延迟的拥塞控制算法
- 基于delay的拥塞控制算法(不是基于丢包)
- Swift 的发展是由存储工作负载、主机网络堆栈和数据中心交换机的趋势推动的
- 通过AIMD(加性增加乘性减少)控制和在极端拥塞情况下的流量控制来实现端到端的延迟目标
- 拆分拥塞:Swift 将拥塞分为两个部分:NIC-to-NIC (fabric) 延迟(数据中心内不同节点间)、Endpoint 延迟(主机之间的传输延迟)。EC和FC,fabric congeston和endpoint congestion。
- Swift 通过分别计算这两部分的拥塞窗口(ecwnd 和 fcwnd)来控制发送速率
- 传统的研究主要集中在 fabric 拥塞上
- 包级别的CC,perPacket。(其他算法还有QP级别、IP级别等)
- 记录数据包在各个时间戳,包括软件、NIC等收发时间戳
- 时间戳影响点:(参考论文原文图)
- 端侧Tx delay,影响因子Tx queue
- 交换机 Forward delay,影响因子 SW queue
- 端侧Rx delay,影响因子Rx queu

谷歌的Swift算法是一种基于延迟的拥塞控制机制,针对数据中心内的EC和FC拥塞拆分进行管理,以保证低延迟和高吞吐。它区分了NIC-to-NIC和Endpoint延迟,并分别控制发送速率。Swift在数据中心环境中表现出低延迟、易于部署和适应多种工作负载的特点,但对硬件依赖和网络条件变化敏感。
最低0.47元/天 解锁文章
4975

被折叠的 条评论
为什么被折叠?



