DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?
转载自 | 新智元
DeepSeek 最近发布的两个模型 —— DeepSeek-V3 和 DeepSeek-R1 以很低的成本获得了比肩 OpenAI 同类模型的性能。
根据外媒的报道,他们在短短两个月时间,在 2,048 个 H800 GPU 集群上,训出 6710 亿参数的 MoE 语言模型,比顶尖AI效率高出 10 倍。
这项突破不是用 CUDA 实现的,而是通过大量细粒度优化以及使用英伟达的
转载自 | 新智元
DeepSeek 最近发布的两个模型 —— DeepSeek-V3 和 DeepSeek-R1 以很低的成本获得了比肩 OpenAI 同类模型的性能。
根据外媒的报道,他们在短短两个月时间,在 2,048 个 H800 GPU 集群上,训出 6710 亿参数的 MoE 语言模型,比顶尖AI效率高出 10 倍。
这项突破不是用 CUDA 实现的,而是通过大量细粒度优化以及使用英伟达的