硬刚英伟达B200！谷歌推出最新AI推理芯片，专为深度思考模型打造

原创已于 2025-04-10 16:17:48 修改 · 864 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #算家云 #AI芯片 #英伟达 #谷歌发布第7代TPU #B200 #算力租赁

于 2025-04-10 16:08:47 首次发布

话题文章专栏收录该内容

245 篇文章

订阅专栏

2025 年 4 月 9 日深夜，在谷歌云 Next 大会上，代号 Ironwood 的第七代 TPU 芯片正式亮相，拉开了算力革命新的序幕。

Ironwood 拥有 4614TFlops 的峰值、192GB 内存与 7.2Tbps 带宽，算力直逼英伟达 B200。与前几代相比，性能是 2017 年第二代 TPU 的 3600 倍，2023 年第五代 TPU 的 10 倍。

Ironwood 是谷歌迄今为止最强大、最节能的 TPU，专为支持思考、推理类模型的大规模应用而设计。

这款性能超强的 AI 推理芯片，带来的不只是硬件升级。谷歌正用一颗专为深度思考而生的芯片，打造满足推理时代更大计算需求的软硬协同生态。

“我们正在见证AI从‘响应式’向‘主动式’的范式迁移。”谷歌机器学习副总裁Amin Vahdat 在演讲中反复强调这一观点。Gemini 2.5 等新一代模型已能主动拆解问题、调用工具、协同推理。这种会思考的 AI，需要芯片像人脑般高效处理逻辑推演与多任务并行——而这正是 Ironwood 的设计理念。

软硬协同的细节方面，Ironwood 的芯片间互连（ICI）网络将双向带宽提升至 1.2Tbps，让 9216 颗芯片组成的超级集群，以 42.5 ExaFLOPS 的总算力碾压目前世界上最大超算 El Capitan。

同时，Ironwood 还与 Pathways 软件栈配合：当 Gemini 模型拆解出推理链条时，系统能自动将子任务分配给不同芯片组，实现高效的分布式计算。

Ironwood 的 4614TFlops 略超 B200 的 4500TFlops，内存带宽虽稍逊于 B200 的 8Tbps，但拥有每瓦 29.3TFlops 的能效比。

值得一提的是，黄仁勋特地为谷歌云 Next 大会录制了一段视频，表示双方将在加密计算服务方面开展合作。

但谷歌的最新发布，无疑加剧了 AI 芯片领域的竞争和英伟达的压力，很多网友直呼“英伟达的地位受到威胁了”。

算力——智能时代的“氧气”

回望 AI 芯片发展史，从 CPU 到 GPU，从训练芯片到推理专用，每一次架构革新都在重塑行业规则。Ironwood 的登场，或许预示着算力竞争进入场景定制化时代。

可以预见的是，随着谷歌与英伟达等芯片巨头的竞争加剧，算力的较量早已超越单纯的硬件参数之争。它揭示了一个清晰的真相：算力，正在成为智能时代的“氧气”。

而未来的算力产业，可能走向三极分化：

一方面，通用芯片时代渐行渐远，针对推理、训练、边缘计算等场景的专用架构将会重塑产业链，如同 Ironwood 对深度思考模型的定向优化。

另一边，据斯坦福《AI指数2025》，随着 AI 耗电量逼近全球总发电量的10%，每瓦性能可能将成为比绝对算力更关键的指标。

最后，开源生态的强势崛起将加速技术平权，从而推动 AI 普惠赋能千行百业。相应地，广大中小企业对于算力的需求将持续增加，AI 算力民主化也将成为算力产业的未来趋势。未来，算力可能会变得像水电一样便捷、高效。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。