150TB/s！d-Matrix用3D堆叠技术终结“内存墙“，AI推理迎来光速时代

原创

于 2025-09-05 12:55:43 发布 · 885 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#3d #人工智能

2025年9月，在芯片设计盛会Hot Chips上，一家名为d-Matrix的公司，展示了一项名为3D堆叠数字内存计算(3DIMC)的颠覆性技术，矛头直指整个AI产业最头疼的难题——"内存墙"。

随着AI从幕后训练走向台前应用，我们的芯片越来越像一个饿着肚子的性能猛兽，而内存带宽就是那条细细的补给线，根本喂不饱它。d-Matrix的方案简单粗暴又充满想象力：直接把计算单元塞进SRAM(静态随机存取存储器)模块里。结果呢？高达150 TB/s的内存带宽，把传统HBM(高带宽内存)甩开了将近20倍。这为AI推理开辟了一条全新的赛道。

AI算力的'阿喀琉斯之踵'，谁来解救？

聊到"内存墙"(Memory Wall)，这可不是什么新鲜词。早在1994年，Wulf和McKee就提出了这个概念，用来形容处理器和内存之间日益扩大的速度鸿沟。你可以想象一下，CPU(中央处理器)的时钟速度跟着摩尔定律像坐了火箭一样，每18个月翻一番，可DRAM(动态随机存取存储器)的性能每年只愿意慢悠悠地提升7-10%。到了2000年代，处理器都跑到GHz级别了，内存访问时间还停留在几十纳秒，性能瓶颈就这么卡住了。

到了AI时代，这个问题被无限放大。训练一个深度神经网络，权重、激活值、梯度这些数据得在内存和计算单元之间来回倒腾。带宽跟不上，再昂贵的计算核心也只能干瞪眼，系统效率一塌糊涂。特别是现在，大型语言模型(LLM)的参数动不动就几千亿，内存带宽这点"小水管"早就扛不住了。

d-Matrix的创始人

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。