GPU 互联选择的挣扎

公众号同名文章: Ostring2024
NextPlatform 的一篇文章,2025年伊始,将它重新整理放在这里,中间穿插了一些自己的理解,现在看来,其中的数据对未来有一些指引。

去年5 月博通推出 “Thor 2” 网卡芯片时,以及 3 月英伟达推出 GB200 NVL72 机架规模系统之后,我们就打趣说,能使用铜缆的时候就用铜缆,必须使用光缆的时候才用光缆。博通和英伟达都会告诉你,机器的经济性和可靠性就取决于这种方法。GB200 NVL72 系统将这一原则发挥到了极致。这个系统用 5184 根粗铜缆72 Blackwell GPU 以完全共享内存配置连接在一起,NVL72 系统核心的九个 NVLink Switch 4 交换机中的 200 Gb / 秒 SerDes 可以通过铜线直接驱动每个Blackwell GPU 上的 1.8 TB / 秒 NVLink 5 端口,无需使用Retimer,当然也不需要长距离数据中心网络中使用的光收发器。

NV Jenson Huang 在发布会也为铜互联站台, 与使用光收发器和重定时器相比,它能节省大约 20 千瓦的功率,使机架功率降至 100 千瓦,而原本功率为 120 千瓦(黄仁勋最初的规格说明中 NVL72 功率为 120 千瓦,但现在的规格说明书显示,使用全铜互连的机架规模节点功率为 100 千瓦。他在讲话时提到的节省的 20 千瓦功率是因为没有使用光组件)。
不管怎样,NVL72 节点的这张图片还是很震撼。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值