拥塞控制算法系列之：Swift-谷歌2020年SIGCOM-包级别端到端TIMELY拥塞控制算法

原创

已于 2024-04-01 02:13:03 修改 · 2.4k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2024-04-01 02:01:36 首次发布

谷歌的Swift算法是一种基于延迟的拥塞控制机制，针对数据中心内的EC和FC拥塞拆分进行管理，以保证低延迟和高吞吐。它区分了NIC-to-NIC和Endpoint延迟，并分别控制发送速率。Swift在数据中心环境中表现出低延迟、易于部署和适应多种工作负载的特点，但对硬件依赖和网络条件变化敏感。

核心要点：

其他：

Swift 是 Google 提出的一种用于数据中心内通信的基于延迟的拥塞控制算法
基于delay的拥塞控制算法（不是基于丢包）
Swift 的发展是由存储工作负载、主机网络堆栈和数据中心交换机的趋势推动的
通过AIMD（加性增加乘性减少）控制和在极端拥塞情况下的流量控制来实现端到端的延迟目标
拆分拥塞：Swift 将拥塞分为两个部分：NIC-to-NIC (fabric) 延迟（数据中心内不同节点间）、Endpoint 延迟（主机之间的传输延迟）。EC和FC，fabric congeston和endpoint congestion。
Swift 通过分别计算这两部分的拥塞窗口（ecwnd 和 fcwnd）来控制发送速率
传统的研究主要集中在 fabric 拥塞上
包级别的CC，perPacket。（其他算法还有QP级别、IP级别等）
记录数据包在各个时间戳，包括软件、NIC等收发时间戳
时间戳影响点：（参考论文原文图）
- 端侧Tx delay，影响因子Tx queue
- 交换机 Forward delay，影响因子 SW queue
- 端侧Rx delay，影响因子Rx queu