【AI加速了技术迭代】
许多技术专家似乎在一件事上达成了共识:创新的速度从未如此之快。为什么呢?
很显然,这是因为人工智能(AI)。如今,各方都在竞相提供差异化的硬件解决方案,以便在边缘端和数据中心实现优化的人工智能性能。
数据科学家、人工智能系统架构师、集成电路设计师、光学工程师、像Samtec这样的互连供应商以及其他解决方案提供商,都在重新思考系统拓扑结构。GPU集群、分解式计算、缓存一致性内存、光互连和 200 Gbps 通道等,这些解决方案都在塑造着人工智能系统架构。
鉴于这些现实情况,许多系统架构师都在思考,PCIe7.0 技术 128 GT/s 的原始比特率是否足够快。考虑到 GPU到GPU 以及 GPU到CPU 的桥接协议已经超过了 200 Gbps,这种质疑似乎是合理的。很多人都在想,作为 GPU 到异构计算处理器(XPU)互连的替代方案,PCIe 7.0 是否能够跟上发展的步伐。
但这个问题问得合理吗?
【PCIe 7.0 与 GPU到XPU 的应用场景】
坦率地说,将 PCIe 7.0 技术与 GPU到XPU 的互连进行比较,并不是一种公平的对等比较。确切地说,这就好比拿关公的青龙偃月刀和鲁班的木工刨子作比较,两者用途和设计初衷大相径庭 。
PCI Express®(及其前身 PCI®)在传统上用于将 x86 CPU 与通用计算应用(如台式机、笔记本电脑、工作站、服务器等)中的各种输入 / 输出(I/O)设备相连。通用计算 I/O 设备的例子可能包括显卡、存储设备、网络适配器,甚至是人工智能加速器。
PCI-SIG®是一个拥有并管理 PCI 规范(作为开放行业标准)的联盟,该组织一直与成员公司合作,每三年将 PCIe 规范的性能提升一倍。按照计划,PCIe 7.0 规范将于 2025年发布,目前他们正按计划推进。
现在让我们来看看 “鲁班的木工刨子” 这边。GPU到XPU 的互连是为了实现高速的、点对点的 GPU到GPU 通信而设计的。在加速计算的早期版本中,系统架构可能是每个 CPU 搭配一个 GPU。简单来说,这是一种 1 个 CPU 对 1 个 GPU 的架构。
随着人工智能模型的发展,1 个 CPU 对多个 GPU(n 个 GPU)的架构迅速出现。由于大语言模型(LLM)和其他模型拥有数万亿个参数,因此需要将数千个 GPU “集群” 起来,以处理必要的并行计算。结果就是,GPU到XPU 的互连速度越来越快。目前,200 Gbps 的 GPU到XPU 互连已成为标准。
那么最终的结果是什么呢?PCIe 7.0 技术是太快了,还是一推出就会被淘汰呢?
这取决于你问的是谁。在Samtec看来,对于那些可在通用计算、加速计算以及不断发展的人工智能系统拓扑结构之间实现数据传输的 I/O 应用场景,PCIe 7.0 技术将对 GPU到 XPU的互连起到补充作用。
不过,问题来了,PCIe 7.0 技术的实际情况究竟如何呢?
【Samtec/Alphawave在128G PAM4上的协同性】
简而言之,支持 PCIe 7.0 的技术是真实存在的,并且已经可以用于原型实现。在24年欧洲光通信会议上,以及后来在开放计算项目峰会上,Alphawave Semi和Samtec展示了 128 Gbps PAM4 系统的协同性。该演示设置将Alphawave Semi的IP与Samtec的高性能互连产品相结合。
Alphawave Semi PipeCORE™ PCI-Express PHY 将 128 GT/s 的数据传输到由各种 Samtec 高性能互连系统组成的 2.5 米多长的传输线上。尽管系统总长度超过 2.5 米,并有 8 个连接点,但仍实现了 e-10 或更好的出色的pre-FEC误码率(BER)。
NovaRay® I/O 面板安装电缆系统是一种高速、高密度的电缆系统,可提供约 4 Tbps 的总数据速率。它是为电缆到电缆的隔板面板连接而设计的。本次演示中的电缆组件长度为 2.0 米。
【小 结】
那么,PCIe® 7.0 技术的出现是否为时尚早呢?它的速度足够快吗?
答案没办法很绝对,但可以这么回答:PCIe 7.0 技术在合适的时间,将是用户合适的解决方案。
因此,我们没法错过他~ 而正如上文所提到的那样,Samtec早已准备就绪!