硬刚英伟达B200!谷歌推出最新AI推理芯片,专为深度思考模型打造

2025 年 4 月 9 日深夜,谷歌云 Next 大会上,代号 Ironwood 的第七代 TPU 芯片正式亮相,拉开了算力革命新的序幕。

图片

Ironwood 拥有 4614TFlops 的峰值192GB 内存与 7.2Tbps 带宽算力直逼英伟达 B200与前几代相比,性能是 2017 年第二代 TPU 的 3600 倍,2023 年第五代 TPU 的 10 倍。

图片

Ironwood 是谷歌迄今为止最强大、最节能的 TPU,专为支持思考、推理类模型的大规模应用而设计。

这款性能超强的 AI 推理芯片,带来的不只是硬件升级。谷歌正用一颗专为深度思考而生的芯片,打造满足推理时代更大计算需求的软硬协同生态

“我们正在见证AI从‘响应式’向‘主动式’的范式迁移。”谷歌机器学习副总裁Amin Vahdat 在演讲中反复强调这一观点。Gemini 2.5 等新一代模型已能主动拆解问题、调用工具、协同推理。这种会思考的 AI,需要芯片像人脑般高效处理逻辑推演与多任务并行——而这正是 Ironwood 的设计理念。

软硬协同的细节方面Ironwood 的芯片间互连(ICI)网络将双向带宽提升至 1.2Tbps,让 9216 颗芯片组成的超级集群,以 42.5 ExaFLOPS 的总算力碾压目前世界上最大超算 El Capitan

同时,Ironwood 与 Pathways 软件栈配合:当 Gemini 模型拆解出推理链条时,系统能自动将子任务分配给不同芯片组,实现高效的分布式计算。

Ironwood 的 4614TFlops 略超 B200 的 4500TFlops,内存带宽虽稍逊于 B200 的 8Tbps,但拥有每瓦 29.3TFlops 的能效比。

图片

值得一提的是,黄仁勋特地为谷歌云 Next 大会录制了一段视频,表示双方将在加密计算服务方面开展合作。

图片

但谷歌的最新发布,无疑加剧了 AI 芯片领域的竞争和英伟达的压力,很多网友直呼“英伟达的地位受到威胁了”。

算力——智能时代的“氧气”

回望 AI 芯片发展史,从 CPU 到 GPU,从训练芯片到推理专用,每一次架构革新都在重塑行业规则。Ironwood 的登场,或许预示着算力竞争进入场景定制化时代

可以预见的是,随着谷歌与英伟达等芯片巨头的竞争加剧算力的较量早已超越单纯的硬件参数之争它揭示了一个清晰的真相:算力,正在成为智能时代的“氧气”。

图片

未来的算力产业,可能走向三极分化:

一方面,通用芯片时代渐行渐远,针对推理、训练、边缘计算等场景的专用架构将重塑产业链,如同 Ironwood 对深度思考模型的定向优化。

另一边,据斯坦福《AI指数2025》随着 AI 耗电量逼近全球总发电量的10%,每瓦性能可能将成为比绝对算力更关键的指标。

最后,开源生态的强势崛起将加速技术平权,从而推动 AI 普惠赋能千行百业。相应地,广大中小企业对于算力的需求将持续增加,AI 算力民主化也将成为算力产业的未来趋势。未来,算力可能会变得像水电一样便捷、高效。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值