
英伟达于周二展示了其新款和计划发布GPU的推理优势,该公司正为数据中心从密集AI训练工作负载向更多样化推理需求的转变做准备。
英伟达凭借其先进的GPU在AI训练市场占据主导地位。但随着需求转向推理工作负载——使用训练好的模型进行预测——不同的用例将需要各种硅解决方案。
这家位于加利福尼亚州圣克拉拉的GPU巨头发布了Rubin CPX,这是一款专为处理大规模上下文而构建的新型GPU。这将使AI系统能够处理百万Token的软件编程和生成式视频。
新设备还承诺为推理任务提供能效和高性能,投资1亿美元可获得50亿美元的Token收入。
Rubin CPX将在英伟达新的Vera Rubin NVL 144 CPX平台内运行。
该公司表示,其由Blackwell Ultra和即将推出的Vera Rubin GPU驱动的新推理数据中心平台将解决最繁重的工作负载。
转向推理市场
随着市场转变,英伟达在数据中心市场份额主导地位可能面临更多来自专注各种推理需求公司的竞争。因此,该制造商押注其顶级GPU为驱动所谓"AI工厂"的专家混合(MoE)大语言模型架构提供所需性能。
根据Markets and Markets报告,全球AI推理市场2025年估值为1060亿美元,预计到2030年将增长至2550亿美元。
"我喜欢英伟达向推理领域倾斜,因为那是市场发展方向,"Moor Insights & Strategy副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示。
"Rubin是一个强大的组件...就像Blackwell相比Hopper一样强大。你说的是开启更快更大的推理,开启那些Token窗口。"
但Kimball表示,该产品并非针对普通企业用户。"这是采用Rubin并创建专门的推理组件

最低0.47元/天 解锁文章
2209

被折叠的 条评论
为什么被折叠?



