OpenAI与Broadcom的合作标志着AI基础设施建设进入了一个前所未有的阶段。在OpenAI官方播客的第八期节目中,OpenAI的首席执行官Sam Altman和总裁Greg Brockman与Broadcom的首席执行官Hock Tan和半导体解决方案事业部总裁Charlie Kawwas齐聚一堂,共同宣布了这项意义重大的合作:双方将联手设计定制化的AI芯片和完整的系统。
这项合作不仅关乎芯片制造,更被Sam Altman誉为**“人类历史上最大的联合工业项目”之一,并且被Charlie Kawwas定位为“正在定义文明的下一代操作系统”**。
一、合作的深层驱动力:垂直整合与定制化需求
OpenAI与Broadcom的合作并非偶然,而是基于双方在各自领域的顶尖地位以及对未来计算需求的共同认知。
1. 应对爆炸式增长的计算需求
OpenAI作为生成式AI和前沿模型的领导者,持续推进着通往“超级智能”(Super Intelligence)的路线图。Greg Brockman指出,目前的计算容量仍然是**“相比我们前进目标来说,只是九牛一毛”**。即使是今天,计算资源的稀缺性也显而易见,例如某些功能(如Pulse、全天候后台运行的个性化Agent)目前仅能对Pro付费用户开放。
Sam Altman提到,他们曾认为将效率优化10倍就能解决所有问题,但实际情况是需求却增加了20倍。面对世界对先进智能不断增长的需求,OpenAI需要巨大的计算基础设施来提供服务。
2. 垂直整合:追求极致效率
此次合作的关键洞察在于“垂直整合”(Vertical Integration)的重要性。Sam Altman表示,当他们意识到世界需要的容量,尤其是推理容量,非常庞大时,他们开始思考是否可以设计专门针对特定工作负载的芯片。
通过与Broadcom合作,他们能够从晶体管的蚀刻一直到最终的Token输出(如ChatGPT的回答)来设计整个系统。这种对整个技术栈(芯片、机架设计、网络、算法与推理芯片的匹配)的优化,能够带来巨大的效率提升,从而实现更好的性能、更快、更便宜的模型。最终目标是从每个单位能源中获取最大的智能产出。
3. Broadcom的独特优势
Hock Tan强调,Broadcom是全球最优秀的半导体公司之一。更重要的是,AI对Broadcom来说是一个令人兴奋的机会,促使他们的工程师在半导体技术领域不断推动创新。Broadcom不仅擅长设计芯片(如AI加速器XPU),而且在系统设计方面也表现出色,这使得双方的合作能够涵盖整个封装。
二、前所未有的规模与基础设施愿景
该合作最具震撼性的部分在于其规划的巨大规模和宏伟愿景。
1. 10吉瓦的增量部署
OpenAI宣布,他们计划在明年底开始部署10吉瓦(10 GW)的系统机架和定制芯片。Sam Altman强调,这10吉瓦是在他们现有与其他合作伙伴和数据中心合作之外的增量容量。
目前OpenAI一年的计算能力约为2吉瓦。加上近期所有合作,计算容量将接近30吉瓦。尽管10吉瓦是一个巨大的容量,Sam Altman预期,如果他们能提供高质量、高速、低价的智能服务,世界将能够超快地吸收并找到令人难以置信的新用途。
2. 定义下一代关键基础设施
多位高管将此项目置于历史性框架中:
- 工业革命: Hock Tan认为,AI基础设施正在成为像铁路或互联网一样的关键公用事业(Critical Utility)。它不仅服务于企业,最终将服务于全球80亿人。
- 人类最大的项目: Sam Altman将AI基础设施的建设描述为**“人类历史上最大的联合工业项目”**。
- 下一代操作系统: Charlie Kawwas则表示,他们正在共同定义“文明的下一代操作系统”。
OpenAI的最终愿景是实现计算资源的富足(Compute Abundance),确保AGI(通用人工智能)造福全人类,并使这项技术能够被全世界所用。
三、深度洞察:AI模型参与设计芯片
此次合作最令人兴奋的技术洞察之一是OpenAI将自身的AI模型应用于芯片设计流程。
1. AI加速设计周期
Greg Brockman透露,他们利用OpenAI的模型来设计这款定制芯片。这使得他们能够:
- 加速进度: 提前推进项目计划(pull on the schedule)。
- 减少面积: 实现了大规模的面积缩小(massive area reductions)。
- 模型优化: 虽然这些优化不一定是人类设计师无法想到的,但模型能够在人类专家需要花费额外一个月时间才能达到的地方,迅速提供二十多项优化。
这种内部建立的专业知识(in-house expertise)不仅能帮助OpenAI实现愿景,也有望提升整个行业。
2. 针对性工作负载优化
设计定制芯片的核心在于优化特定工作负载。Hock Tan解释了定制芯片的必要性:
- 训练(Training): 需要设计在TFLOPs和网络能力上更强的芯片集群。
- 推理(Inference): 则需要更多的内存和内存访问能力,而非单纯的计算能力。
定制芯片平台将随着模型的迭代(如GPT-5、6、7)不断改进。
3. 硬件的未来:走向三维与光通信
Charlie Kawwas分享了Broadcom在硬件路线图上的前沿探索,这些技术将推动计算能力和效率的飞跃:
- 多维集成: 从将多个芯片在二维空间(2D space)中集成,到讨论将芯片堆叠到第三维度(Z轴)。
- 光通信集成: 最终步骤是将光通信技术引入芯片,目前已宣布集成了100兆兆位(100 terabits)交换能力的光学技术。
这些技术进步有望使集群的性能和功耗效率提升到新的水平,计算能力将至少每六到十二个月翻一番。
四、AGI的旅程:计算即经济增长的驱动力
此次合作是OpenAI通往AGI旅程中的重要一步。Greg Brockman回顾了OpenAI的历史,指出在2017年,他们通过经验发现,规模(Scale)是获得最佳成果的关键。
Sam Altman展望未来,认为随着模型变得越来越智能(例如GPT-6的智能水平远超GPT-5),并且能够处理持续数天、数周甚至数月的任务,同时成本下降,由此产生的经济价值和需求盈余将呈爆炸性增长。
Greg Brockman总结道,智能是经济增长和提升人类生活水平的根本驱动力。通过AI,他们正在放大每个人的智能。每当OpenAI创造新的效率,让更多人能够使用这些产品时,这种进步都会造福更多人,这也是他们持续努力的激励因素。
这项合作计划于明年底开始部署,并在接下来的三年内迅速推广。OpenAI和Broadcom的联手,不仅是两大科技巨头的商业联盟,更是人类为构建下一代智能基础设施而进行的一场宏大而必要的“登月计划”。
原始视频:https://youtu.be/qqAbVTFnfk8?si=O9fN1yM-WCDQEnb_
中英文字幕:
OpenAI与Broadcom的AI基础设施巨擘合作


被折叠的 条评论
为什么被折叠?



