2025 年 4 月 9 日深夜,在谷歌云 Next 大会上,代号 Ironwood 的第七代 TPU 芯片正式亮相,拉开了算力革命新的序幕。

Ironwood 拥有 4614TFlops 的峰值、192GB 内存与 7.2Tbps 带宽,算力直逼英伟达 B200。与前几代相比,性能是 2017 年第二代 TPU 的 3600 倍,2023 年第五代 TPU 的 10 倍。

Ironwood 是谷歌迄今为止最强大、最节能的 TPU,专为支持思考、推理类模型的大规模应用而设计。
这款性能超强的 AI 推理芯片,带来的不只是硬件升级。谷歌正用一颗专为深度思考而生的芯片,打造满足推理时代更大计算需求的软硬协同生态。
“我们正在见证AI从‘响应式’向‘主动式’的范式迁移。”谷歌机器学习副总裁Amin Vahdat 在演讲中反复强调这一观点。Gemini 2.5 等新一代模型已能主动拆解问题、调用工具、协同推理。这种会思考的 AI,需要芯片像人脑般高效处理逻辑推演与多任务并行——而这正是 Ironwood 的设计理念。
软硬协同的细节方面,Ironwood 的芯片间互连(ICI)网络将双向带宽提升至 1.2Tbps,让 9216 颗芯片组成的超级集群,以 42.5 ExaFLOPS 的总算力碾压目前世界上最大超算 El Capitan。
同时,Ironwood 还与 Pathways 软件栈配合:当 Gemini 模型拆解出推理链条时,系统能自动将子任务分配给不同芯片组,实现高效的分布式计算。
Ironwood 的 4614TFlops 略超 B200 的 4500TFlops,内存带宽虽稍逊于 B200 的 8Tbps,但拥有每瓦 29.3TFlops 的能效比。

值得一提的是,黄仁勋特地为谷歌云 Next 大会录制了一段视频,表示双方将在加密计算服务方面开展合作。

但谷歌的最新发布,无疑加剧了 AI 芯片领域的竞争和英伟达的压力,很多网友直呼“英伟达的地位受到威胁了”。
算力——智能时代的“氧气”
回望 AI 芯片发展史,从 CPU 到 GPU,从训练芯片到推理专用,每一次架构革新都在重塑行业规则。Ironwood 的登场,或许预示着算力竞争进入场景定制化时代。
可以预见的是,随着谷歌与英伟达等芯片巨头的竞争加剧,算力的较量早已超越单纯的硬件参数之争。它揭示了一个清晰的真相:算力,正在成为智能时代的“氧气”。

而未来的算力产业,可能走向三极分化:
一方面,通用芯片时代渐行渐远,针对推理、训练、边缘计算等场景的专用架构将会重塑产业链,如同 Ironwood 对深度思考模型的定向优化。
另一边,据斯坦福《AI指数2025》,随着 AI 耗电量逼近全球总发电量的10%,每瓦性能可能将成为比绝对算力更关键的指标。
最后,开源生态的强势崛起将加速技术平权,从而推动 AI 普惠赋能千行百业。相应地,广大中小企业对于算力的需求将持续增加,AI 算力民主化也将成为算力产业的未来趋势。未来,算力可能会变得像水电一样便捷、高效。
513

被折叠的 条评论
为什么被折叠?



