DeepSeek R2 推迟发布:因 H20 算力短缺

DeepSeek 今年早些时候凭借其 R1 AI 模型备受广泛关注。据The Information报道,R2 模型的工作似乎因 H20 处理器而停滞不前。

图片

DeepSeek尚未透露其R2 模型的具体上市时间。

DeepSeek 使用 5 万块 Hopper GPU(包括 万块 H20万块 H800 和 万块 H100)组成的庞大集群来训练其 R1 模型。

目前尚不清楚 R2 是否已完成了全面的预训练工作

The Information》报道称DeepSeek 团队一直在深入研究开发 R2 模型,但 CEO 梁文对其性能尚不满意。团队仍在内部努力提升性能。

据《The Information》报道,如果 DeepSeek 即将推出的 R2 模型其性能目前市面上开放替代模型,预计使用量将激增,超出中国云平台的处理能力。

据称,大多数依赖早期R1 模型的组织都使用H20 来运行该模型,而这款处理器已经被美国限制,目前出现了供应短缺的局面

经@大单网 查询,目前 DeepSeek 相关的招投标项目达 1000 + 个。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值