DeepSeek新模型上线！引入DSA新稀疏注意力，还又狙了CUDA一枪

转载于 2025-09-29 18:44:11 发布 · 136 阅读

·

1

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247829516&idx=1&sn=005991b82e58ae5dc955a076b27a4560&chksm=e98a94e9cbb288a8d04afd96e07c3d534699204c989e371b5df94fcae7666399b6d8044835b4&scene=126&sessionid=0

部署运行你感兴趣的模型镜像

编辑部发自凹非寺
量子位 | 公众号 QbitAI

刚发V3.1“最终版”，DeepSeek最新模型又来了！

DeepSeek-V3.2-Exp刚刚官宣上线，不仅引入了新的注意力机制——DeepSeek Sparse Attention。

还开源了更高效的TileLang版本GPU算子！

目前，官方App、网页端、小程序均已同步更新，同时还有API大减价：5折起。

这波DeepSeek国庆大礼包，属实有点惊喜了。

新注意力机制

DeepSeek-V3.2-Exp基于上周刚更新的DeepSeek-V3.1-Terminus打造，核心创新是引入了DeepSeek Sparse Attention（DSA）稀疏注意力机制。

DSA首次实现了细粒度注意力机制，能在几乎不影响模型输出效果的前提下，实现长文本和推理效率大幅提升。

与前不久更新的DeepSeek-V3.1-Terminus对比，在各领域公开测评集上，DeepSeek-V3.2-Exp和V3.1-Terminus基本持平。

V3.1-Terminus是在 DeepSeek-V3.1基础上的一个强化版本，在稳定性、工具调用能力、语言一致性、错误修正等方面进行迭代改进。

另外，论文提到，使用DSA的模型在处理128K长上下文时，推理成本显著低于DeepSeek-V3.1-Terminus，尤其在解码阶段。

TileLang & CUDA双版本算子开源

DeepSeek还表示，在新模型研发过程中，需要设计和实现很多新的GPU算子。

他们使用高级语言TileLang进行快速原型开发，并在最后阶段，以TileLang作为精度基线，逐步使用底层语言实现更高效的版本。

因此，V3.2开源的主要算子包括TileLang和CUDA两种版本。

官方还附上一句：

我们建议社区在进行研究性实验时，使用基于TileLang的版本以方便调试和快速迭代。

官方API的价格也顺势来了个5折起，新价格即刻生效。

这还等什么…朋友们国庆整起来吧。

指路↓

HuggingFace：
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope：
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
论文：
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

One More Thing

除了DeepSeek-V3.2之外，据说智谱的GLM-4.6也在路上了。

从下拉菜单可以看到，他们已经把GLM-4.5标成了“上一代旗舰模型”。

下午还刚在GitHub上刷到这张“国庆是休息日，请给我们关注的同学一点时间”的图：

好好好，为了放假，都打算在节前卷了是吧（手动狗头）。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。