公众号同名文章: Ostring2024
NextPlatform 的一篇文章,2025年伊始,将它重新整理放在这里,中间穿插了一些自己的理解,现在看来,其中的数据对未来有一些指引。
去年5 月博通推出 “Thor 2” 网卡芯片时,以及 3 月英伟达推出 GB200 NVL72 机架规模系统之后,我们就打趣说,能使用铜缆的时候就用铜缆,必须使用光缆的时候才用光缆。博通和英伟达都会告诉你,机器的经济性和可靠性就取决于这种方法。GB200 NVL72 系统将这一原则发挥到了极致。这个系统用 5184 根粗铜缆将 72 Blackwell GPU 以完全共享内存配置连接在一起,NVL72 系统核心的九个 NVLink Switch 4 交换机中的 200 Gb / 秒 SerDes 可以通过铜线直接驱动每个Blackwell GPU 上的 1.8 TB / 秒 NVLink 5 端口,无需使用Retimer,当然也不需要长距离数据中心网络中使用的光收发器。
NV Jenson Huang 在发布会也为铜互联站台, 与使用光收发器和重定时器相比,它能节省大约 20 千瓦的功率,使机架功率降至 100 千瓦,而原本功率为 120 千瓦(黄仁勋最初的规格说明中 NVL72 功率为 120 千瓦,但现在的规格说明书显示,使用全铜互连的机架规模节点功率为 100 千瓦。他在讲话时提到的节省的 20 千瓦功率是因为没有使用光组件)。
不管怎样,NVL72 节点的这张图片还是很震撼。