RISC-V入侵数据中心,挑战与机遇并存的未来趋势

数据中心非常重视性能和提供工作负载,同时保持能源效率。

为了实现这些目标,开放指令集架构 RISC-V 越来越多地被用作数据中心的加速器,因为它提供了很大的灵活性,这对于 AI 来说尤其重要。我们采访了 SiFive 高级总监 Ian Ferguson,讨论了这项技术为何成为服务器市场的关键。

BN:从您的角度来看,服务器市场是如何发展的?

IF:2008 年,我是 Arm 探索并随后进入服务器市场的首批两位发起人之一。当时,英特尔是占主导地位的供应商,拥有超过 97% 的市场份额。AMD 拥有其余份额。当时没有 GPGPU 市场(NVIDIA 将 GPU 出售给高性能 PC、笔记本电脑等客户端应用程序)。除了一些研究实验之外,人工智能并不存在。软件主要由第三方拥有。

快进到今天,AMD 实力雄厚。随着 GPGPU 成为实现人工智能训练算法的关键技术,NVIDIA 占据了更大的主导地位。亚马逊等公司已表示计划将其 CPU 供应商基础分为 x86 供应商(英特尔和 AMD)和 Arm(内部开发和外部供应商)和 RISC-V。软件(一些 GPGPU 部分除外)是以下组合:

  • 开源

  • 第一方软件(代码由 Apple、Amazon、Google、Meta 和 Microsoft 拥有、维护、改进和优化)

BN:为什么服务器市场对 RISC-V 的需求越来越大?

IF:目前服务器市场正在发生三大转变:

由于工作负载多种多样且市场瞬息万变,因此不可能定义完美的 ASIC。但显而易见的是,需要将通用计算与加速器技术相结合。后者可以是 GPGPU 和其他专用硬件的组合。

云计算公司希望优化其解决方案,以获得超越竞争对手的竞争优势。对于许多此类公司而言,他们有商业理由来制造定制芯片。他们最了解自己的工作负载,并将优化视为与竞争对手的差异化领域。供应商的最大机会是为云计算公司提供其设计所需的构建模块。

人工智能正在走向边缘。因此,服务器的成本、功率和尺寸要求迫使公司考虑与传统组件不同的组件。

客户需要一种能够以与市场变化速度同步的速度发展的架构。RISC-V 提供了一种现代化、全新的设计,具有无与伦比的灵活性、可扩展性和可扩展性。开发人员可以自定义他们的设计以优化性能、功耗、成本和/或延迟。最近的例子是增加对 AI 工作负载的改进。这始于 RISC-V Vector (RVV) 规范,工作组正在合作开发其他增强功能,以进一步改进 AI 训练和推理工作负载的实施。此外,使用 RISC-V,不存在供应商锁定,因此公司有更多选择。

在软件方面,云计算公司同时使用开源软件和第一方软件。推动开源工作的主要举措是 RISC-V 软件生态系统 (RISE) 项目,这是一项合作努力,旨在为数据中心、汽车、移动、消费电子产品等领域的 RISC-V 处理器开发强大的软件生态系统。随着我们从“移植到 RISC-V”过渡到“针对 RISC-V 进行优化”,我们将继续看到显着的性能改进。这为云计算公司优化其第一方软件提供了基础平台。

全球范围内对 RISC-V 的兴趣日益高涨,尤其是中国,正在迅速将 RISC-V 引入数据中心,尤其是在成熟的云计算公司。

BN:RISC-V 目前在云应用中的采用情况如何?

IF:RISC-V 的伟大之处在于它能够赋能创新。SiFive 的重点更多地放在增强现有的软件生态系统解决方案上,而不是与现有的处理器架构正面交锋。我们看到云计算公司对我们的智能产品线表现出极大的兴趣,这些产品线可帮助组件设计高效的神经处理单元,为特定工作负载提供出色的性能,无论是图像识别、语音翻译、医疗诊断等。

RISC-V 解决方案的其他创建者正集中精力赢得服务器中的主要 CPU 插槽。

BN:高性能计算领域对 RISC-V 的需求如何?

IF:高性能计算领域有大量 RISC-V 活动。原因之一是有很多第一方软件,这降低了新处理器技术的进入门槛。此外,许多工作负载不需要很高的单线程性能,因为拥有多个较小的处理器就可以了。

随着公司越来越关注计算对环境的影响,可持续性也越来越受到关注。公司不仅要制造最快的机器,而且还在努力制造最环保的机器(我们在 Green500 上看到的就是如此)。RISC-V 是一种干净的架构——没有数十年使用遗留的包袱——这使公司能够设计出极其高效的解决方案。

当然,如果公司想在 RISC-V 上设计极高性能的系统,他们也可以这样做。我们还看到许多地区——包括中国、欧洲、印度、日本和美国——正在开发极其强大的 RISC-V 机器。

BN:SiFive 如何满足服务器对 RISC-V 的需求?

IF:SiFive 的半导体合作伙伴已向各种市场交付了超过 20 亿个 SiFive 处理器。如上所述,SiFive 主要专注于云计算和高性能计算领域,我们的客户正在使用我们的 RISC-V 解决方案来增强系统中的主处理器。SiFive 的智能处理器提供高性能标量和矢量计算能力,以满足这些领域的最新 AI 要求。谷歌等公司正在使用 RISC-V 矢量处理器与收缩矩阵乘法器加速器相结合,为计算密集型 AI/ML 工作负载提供更大的灵活性。

我们还开发了 SiFive 矢量协处理器接口扩展 (VCIX),允许自定义矢量指令从矢量管道在加速器上执行。这有助于简化自定义加速器的设计流程,同时也使编程更容易。此外,这种方法还可以提高系统性能并提高功率和面积效率。

BN:您认为 10 年后 RISC-V 在服务器中的应用将会是什么样子?

IF:这是一个充满挑战的时间段,因为这个行业领域变化如此之快。人工智能和 NVIDIA 现在都处于许多对话的前沿,而七年前几乎没有被讨论过,更不用说十年了。过去几年,人工智能模型的架构发生了巨大变化,从卷积网络到transformer。这种变化速度导致了可以调整以支持模型变化的加速器。随着时间的推移,我预计这种模型变化速度会减慢,因为成功的技术方法(硬件和软件)开始出现。

我们看到,在其他技术中,当事物成为主流并稳定时,就会有更多的集成机会。虽然你可以找到提供 USB 或以太网功能的分立芯片,但大多数主流半导体元件都集成了这些功能。在人工智能领域,对特定应用加速器的需求将减少。相反,此功能将成为标准 CPU 的一部分,以节省占用空间、功耗和成本。

此外,在未来十年,我们将看到 RISC-V 与现有产品之间的性能差距缩小。随着竞争环境的公平化,获胜者将是那些能够以最具成本效益和最快速度实现其价值和差异化的公司。

参考链接

https://betanews.com/2024/07/03/how-risc-v-is-changing-the-server-market-qa/

来源:内容由半导体芯闻,编译自betanews

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值