DeepSeek R2 推迟发布：因 H20 算力短缺

最新推荐文章于 2025-09-23 09:00:00 发布

原创最新推荐文章于 2025-09-23 09:00:00 发布 · 535 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

DeepSeek 今年早些时候凭借其 R1 AI 模型备受广泛关注。据《The Information》报道，R2 模型的工作似乎因 H20 处理器而停滞不前。

DeepSeek尚未透露其R2 模型的具体上市时间。

DeepSeek 使用 5 万块 Hopper GPU（包括 3 万块 H20、1 万块 H800 和 1 万块 H100）组成的庞大集群来训练其 R1 模型。

目前尚不清楚 R2 是否已经完成了全面的预训练工作。

《The Information》报道称，DeepSeek 团队一直在深入研究开发 R2 模型，但 CEO 梁文锋对其性能尚不满意。团队仍在内部努力提升性能。

据《The Information》报道，如果 DeepSeek 即将推出的 R2 模型其性能超过目前市面上的开放替代模型，预计使用量将激增，超出中国云平台的处理能力。

据称，大多数依赖早期R1 模型的组织都使用H20 来运行该模型，而这款处理器已经被美国限制，目前出现了供应短缺的局面。

经@大单网查询，目前 DeepSeek 相关的招投标项目达 1000 + 个。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AIBigModel

关注关注

9
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

DeepSeek（1）：DeepSeek简介

u013938578的博客

03-14

2909

1.公司背景：DeepSeek，全称杭州深度求索⼈⼯智能基础技术研究有限公司，成⽴于2023年7⽉，是⼀家专注于⼤语⾔模型（LLM）和相关技术开发的创新型科技公司。2.技术特⾊：DeepSeek以低成本、⾼性能的⼤语⾔模型技术著称，坚持开源路线和技术创新，推动⼈⼯智能的普惠发展。3.模型发展：DeepSeek系列模型包括DeepSeek LLM、DeepSeek-V3等，每⼀代模型都在架构设计、训练算法、推理效率和模型表现上实现了显著的创新与优化。

参与评论您还未登录，请先登录后发表或查看评论

AI热点周报（8.10~8.16）：AI界“冰火两重天“，GPT-5陷入热议，DeepSeek R2模型训练受阻？

Code_流苏：在代码中寻诗意，在实践中觅真知

08-16

1557

热乎的周报来了！本周，AI界可谓"冰火两重天"：GPT-5发布引发用户吐槽，美国政府却花1美元抢购ChatGPT，开源模型掀起新浪潮，算力争夺战愈演愈烈。这背后究竟发生了什么？

传DeepSeek R2放弃Transformer，采用“递归认知格”，效率提高400倍！

2401_85325557的博客

05-20

1163

近日，一则源自所谓“中国DeepSeek Labs内部消息人士”的爆料，如同一场突如其来的风暴，席卷了全球人工智能关注者的视野。核心爆料内容直指DeepSeek最新一代模型R2，声称其已彻底抛弃当前主流的Transformer架构，转而采用一种被称为“递归认知格”（Recursive Cognition Lattices）的全新理论框架。倘若属实，这不仅仅是技术的迭代，更可能是一场颠覆现有AI认知边界的范式革命。

DeepSeek与清华联合发布重磅论文：从 SPCT 到 Meta Reward Model，或预示DeepSeek R2将近

LinkTime_Cloud的博客

04-23

2038

这一成果不仅被视作DeepSeek下一代推理模型R2的技术基石，更在全球AI界掀起轩然大波——它意味着，传统依赖“训练时优化”的AI发展模式，正在被“推理时扩展”的颠覆性方法论取代。2025年4月4日，中国人工智能企业深度求索（DeepSeek）与清华大学研究团队联合发布题为《奖励模型的推理时Scaling方法及其在大规模语言模型中的应用》的重磅论文，提出。例如，在代码生成任务中，模型可同时评估代码的功能性、可读性和执行效率，并通过元模型过滤低质量反馈。论文提及的元奖励模型框架可直接应用于现有大模型升级。

DeepSeek宣布年底正式亮剑OpenAI，DeepSeek-R2将杀入智能体战场！

m0_74942241的博客

09-12

1378

DeepSeek正研发新一代AI智能体模型R2，预计第四季度发布。通过"训练后优化"技术，新模型将具备自我学习和进化能力，能独立完成复杂任务。DeepSeek-V3.1已展示更强Agent能力，标志着AI从单纯回答问题向主动执行任务转变。智能体被视为AI进化方向，2025年可能成为大模型标配，有望降低技术门槛。

传统IT人如何拥抱AI大模型：入门指南

weixin_45607947的博客

06-13

991

在当前技术飞速发展的时代，AI大模型（如GPT-4、BERT等）已经成为企业提升效率和创新的重要工具。然而，对于许多传统IT从业人员而言，由于数学基础薄弱且缺乏算法调优的能力，如何入门和应用这些先进技术成为一个难题。本文将提供一些实用建议，帮助传统IT从业人员逐步迈入AI大模型的世界。

AI产品经理面试想拿Offer？这100道题不仅告诉你答案，还揭秘出题人的小心思！

m0_65555479的博客

07-16

1328

本文系统梳理了AI大模型领域的100道核心问题，涵盖技术基础（25题）、产品设计（20题）、项目管理（15题）、商业化策略（15题）、伦理合规（15题）和行业洞察（10题）六大维度。重点包括：技术落地的四步风险控制法、产品设计的MoSCoW优先级框架、联邦学习在隐私合规中的应用、多模态产品的渐进式开发策略、伦理委员会的决策机制等实战方法论，并配套提供大模型学习路线图、100套商业化方案及200本专业书籍等资源包。文章强调AI产品经理需具备技术变现能力、合规意识和终局思维，通过"业务指标+模型指标+用户满意度

DeepSeek联合清华公布推理时Scaling新论文！R2要来了？

Datawhale

04-04

864

通过更大规模的采样，DeepSeek-GRM 可以更准确地判断具有更高多样性的原则，并以更细的粒度输出奖励，从而解决挑战。本周五提交的一项工作中，来自 DeepSeek、清华大学的研究人员探索了奖励模型（RM）的不同方法，发现逐点生成奖励模型（GRM）可以统一纯语言表示中单个、成对和多个响应的评分，从而克服了挑战。受到初步实验结果的启发，研究者提出了一种用于逐点通用奖励模型的新方法，能够学习生成具有适应性和高质量的原则，以有效引导批评内容的生成，该方法被称为自我原则批评调整（SPCT）。

从零开始：H20服务器上DeepSeek R1 671B大模型部署与压力测试全攻略

wangli的博客

03-02

1万+

最近，我有幸在工作中接触到了DeepSeek R1 671B模型，这是目前中文开源领域参数量最大的高质量模型之一。DeepSeek团队在2024年推出的这款模型，以其惊人的6710亿参数量和出色的推理性能，引起了业界广泛关注。作为一名AI基础设施工程师，我有机会在H20服务器上部署这个庞然大物，并对其进行了全面的压力测试。这篇文章将详细记录我的部署过程和性能测试方法，希望能为大家提供一些参考。💡为什么选择DeepSeek R1？超大规模参数量（671B）优秀的中英文理解能力开源可商用的许可证。

N9H20_emWin_NonOS:N9H20 emWin非操作系统BSP

03-19

《N9H20_emWin_NonOS：构建基于C语言的嵌入式GUI系统》在嵌入式系统开发中，用户界面（UI）的设计和实现是至关重要的环节，它直接影响到产品的用户体验和市场竞争力。本文将深入探讨N9H20_emWin_NonOS项目，这是一...

Deepseek爆火之下所隐藏的算力平台：技术架构、挑战与行业变革

qq_73376107的博客

03-07

1967

Deepseek爆火之下所隐藏的算力平台：技术架构、挑战与行业变革2025年初，Deepseek凭借其高性能AI模型和开源策略迅速成为全球AI领域的焦点。然而，其爆火的背后，一个更为关键的角色被广泛讨论却鲜少被深入剖析——支撑Deepseek运行的算力平台。本文将从技术架构、硬件配置、资源调度等维度，揭示这一平台的运作逻辑与行业影响。

重磅！DeepSeek有望提前发布新一代模型R2和V4

2401_85343303的博客

03-27

6783

DeepSeek在春节期间发布的R1在中国掀起了一股AI热潮，甚至带动了A股、港股的科技股上涨。但从各种排行榜来看，R1的领先势头并未保持太久，全球科技公司AI大模型竞争白热化，新品不断推出，热点一波接一波，如果一个公司没有长期的竞争力，恐怕很快会被消费者遗忘。对于DeepSeek何时推出下一代模型，备受外界关注。市场普遍预期R2将带来显著的技术进步，包括更强的代码生成能力和更广泛的多语言推理能力。

刚刚，DeepSeek 更新了！终极伏笔，R2 真要来了？

最新发布

hunteritself的博客

09-23

760

刚刚，DeepSeek 更新了！终极伏笔，R2 真要来了？

DeepSeek R2 或吊打 GPT-5！DeepSeek 与清华大学联合发布的论文，引发热议！DeepSeek 热度再涨！

javatiange的博客

04-09

1600

无论 R2 最终能否完全实现我们的期望，它的发布都注定将成为 AI 领域的一个重要里程碑，促使其他 AI 团队不断探索新的技术路径和应用场景，R2 的登场将为 AI 时代带来新的变局，推动 AI 技术迈向一个新的高度。**数学推理精度提升：**借助论文提出的推理时动态扩展和自我原则点评调优（SPCT）方法，优化模型在复杂数学推理过程中的表现，进一步降低代数 / 算术错误率，争取在数学竞赛类测试中准确率突破 90%。**代码生成效率革新：**强化对大规模代码库的学习与理解，实现更高效的代码生成。

即将迎来DeepSeek-R2震撼升级：算力狂飙300%，颠覆AI未来！

bugyinyin的博客

05-20

1264

即将发布的 DeepSeek R2，则在技术架构、参数设置、推理效率、多模态处理及多语言支持等方面实现了全方位的提升，甚至在成本效率和硬件适配上做出了显著优化。这篇文章将围绕 DeepSeek R2 与前代产品 R1 之间的多方面改进进行深入对比与解析，结合数个权威来源的信息数据，全面展示新版本的技术突破和市场影响。

DeepSeek R2要来了！大摩率先曝光，参数翻倍、推理成本暴降88%

datian1234的博客

06-09

1855

R2模型的参数量从R1的6710亿直接飙升到了1.2万亿，这是什么概念？整整翻了近一倍！更厉害的是，活跃参数也从原来的370亿涨到了780亿。这意味着什么？简单来说，就是R2每次"思考"的时候，会调用更多的"脑细胞"来处理问题。就像一个人原本只用了30%的大脑，现在可以用到60%一样，思考的深度和质量自然会有质的飞跃。

DeepSeek R2：即将发布的新一代人工智能模型

m0_68705118的博客

03-17

1681

DeepSeek R2的发布无疑将成为2025年人工智能领域的一大亮点。无论其最终发布时间如何，R2在编程能力、多语言推理和成本效益等方面的突破都让人充满期待。随着人工智能技术的不断发展，DeepSeek R2或将推动整个行业迈向新的高度。

DeepSeek R2延期原因大公开，芯片+模型两大难题，远比你想的复杂！

2401_84204413的博客

07-17

2626

DeepSeek R2大模型发布遇阻：高要求与算力短缺的双重困境国产AI大模型DeepSeek R2已完成训练但迟迟未发布，面临两大核心挑战：一是CEO梁文锋对产品标准要求极高，认为当前版本在关键能力上仍未达标；二是受美国芯片禁令影响，H20算力芯片断供导致部署困难。与行业"先发制人"的策略不同，DeepSeek坚持"体验优先"的产品理念，宁可推迟发布也要确保质量。业内人士推测，若芯片问题能在三季度缓解，R2或于Q4面世。这一事件折射出中国AI产业在技术创新与供应链

DeepSeek R2震撼发布在即：国产AI大模型迎来“成本革命”与“技术跃迁”

热门推荐

2401_85343303的博客

05-03

1万+

在人工智能领域风起云涌的2025年，中国AI公司深度求索(DeepSeek)即将发布其新一代大语言模型DeepSeek R2，这一消息已在科技圈引发广泛关注。据多方信源显示，DeepSeek R2不仅将在模型规模上实现翻倍增长，更通过一系列技术创新实现了惊人的97%成本下降，同时完全基于国产昇腾芯片完成训练，标志着中国AI产业在"软硬结合"道路上迈出了关键一步。

A100 vs h20 算力

06-13

### NVIDIA A100 vs H20 算力性能对比 NVIDIA A100 和 H20 是两款针对高性能计算和人工智能应用设计的 GPU，但它们在架构、核心数量以及特定工作负载上的表现存在显著差异。以下是两者的算力性能对比： #### 1. 架构与制程技术 A100 基于 Ampere 架构，采用 7nm 制程工艺[^1]。而 H20 属于 NVIDIA 的最新 Hopper 架构系列，同样采用了更先进的制程技术（通常为 5nm 或 4nm）。Hopper 架构引入了 Transformer 引擎，专为加速自然语言处理和其他 AI 模型训练任务设计。因此，在涉及 Transformer 模型的工作负载中，H20 相较于 A100 具有明显的优势。 #### 2. CUDA 核心与 Tensor 核心 A100 配备了 5120 个 CUDA 核心和第一代 Tensor Cores 技术[^1]，支持高效的并行计算能力。相比之下，H20 提供了更高数量的 CUDA 核心和更新一代的 Tensor Cores，能够实现更快的并行处理速度[^2]。这种提升使得 H20 在处理大规模数据集、训练大型语言模型以及运行复杂模拟时表现出更高的效率。 #### 3. 内存带宽与容量 A100 配备了高达 80GB 的 HBM2 显存，内存带宽达到 2TB/s[^1]。而 H20 在内存配置上进一步优化，提供了更大的显存容量和更高的带宽，确保在高吞吐量场景下的稳定性和性能。对于需要频繁访问大量数据的应用（如多模态模型训练），H20 的优势更加突出。 #### 4. 精度支持与算力 - **FP16 算力**：A100 的 FP16 算力为 312 TFLOPs，而 H20 在这一精度下表现出更高的算力。 - **TF32 算力**：A100 的 TF32 算力为 156 TFLOPs，而 H20 在相同精度下的表现更为优越[^3]。 - **FP8 精度**：H20 支持 FP8 精度，这是其相较于 A100 的一大亮点，特别适用于需要高吞吐量推理的任务。 #### 5. 特定应用场景 - **A100 更适合**：百万级参数模型微调、传统高性能计算（HPC）应用以及边缘计算节点等场景[^5]。 - **H20 更适合**：千亿参数级模型研发、高吞吐实时推理（>10万 QPS）、多模态模型训练（需 FP8 精度）等高级 AI 应用场景。 ```python # 示例代码：比较 A100 和 H20 的理论峰值算力 a100_fp16_tflops = 312 h20_fp16_tflops = 350 # 假设值，具体取决于实际规格 if h20_fp16_tflops > a100_fp16_tflops: print("H20 在 FP16 算力上优于 A100") else: print("A100 在 FP16 算力上优于 H20") ``` #### 结论综合来看，H20 在架构设计、CUDA 核心数量、Tensor 核心性能以及内存配置等方面均优于 A100，尤其在处理复杂的 AI 工作负载时表现出色。然而，如果预算有限或仅需完成相对简单的任务，A100 仍然是一个性价比高的选择[^5]。