deepseek究竟处于一个什么水平？

星河AI观测站

已于 2025-02-12 21:11:24 修改

阅读量1k

点赞数 10

文章标签： deepseek ai发展

于 2025-02-12 21:10:13 首次发布

本文链接：https://blog.youkuaiyun.com/lc19890709/article/details/145600015

版权

星河的知乎回答-deepseek究竟处于一个什么水平？

DeepSeek 超越了 Meta Llama 毫无疑问，但相比 OpenAI、Anthropic 和 Google 这些第一梯队 players 可能还有些距离，比如 Gemini 2.0 Flash，它成本比 DeepSeek 更低，能力也很强，且全模态。我们不能低估以 Gemini 2.0 为代表的第一梯队的能力，只是它们没有开源而获得这么炸裂轰动性的效果。

从技术角度上讲，DeepSeek 有下面几个亮点：

• 开源：开源这点很重要，OpenAI 从 GPT-3 开始转为闭源公司后，第一梯队三巨头就不再公开技术细节，拱手让出了一个空白的开源生态位，但 Meta 和 Mistral 并没有接稳这个位置，DeepSeek 这次堪称奇袭，在开源这块大赛道一马平川。

如果把轰动性打 100 分，智能提升贡献 30 分，开源贡献 70 分，之前 LLaMA 也开源但没有这么轰动的效果，说明 LLaMa 智能水平不够。

• 便宜：“Your margin is my opportunity” 这句话的含金量还在上升。

• 联网+公开 CoT：对于用户这两个点分别都能带来很好的用户体验，DeepSeek 把两张牌同时出了，可以说是王炸，给到 C 端用户的体验和其他 Chatbot 完全不一样。尤其是 CoT 透明，把模型思考过程公开了，透明能让用户对 AI 更信任，促进了破圈。不过，按理说 Perplexity 也是冲击很大的，但 DeepSeek 服务端不稳定，Perplexity 团队快速反应上线了 R-1 反而承接了很大 DeepSeek R-1 溢出的用户。

• RL 泛化：虽然 RL 是 OpenAI o1 最先提出来的，但因为各种运营一直半遮半掩，渗透率并不高，DeepSeek R-1 很大意义推动了 reasoning model 范式的进程，生态接受度大幅提升。

严格来讲，DeepSeek 并没有发明新范式，它的重要意义在于帮助 RL 和 test time compute 这个新范式真正出圈。如果说 OpenAI 最初发布的 o1 是给行业出了一个谜语，DeepSeek 就是第一个公开解谜的人。

DeepSeek 发布 R1 和 R1-zero 之前，行业只有少部分人在实践 RL 和 reasoning model，但 DeepSeek 给大家指明了路线图，让行业相信这样做真的能提升智能，这对提升信心，吸引更多 AI researcher 转向新范式的研究有巨大的帮助。

有人才进入，才有算法创新，有开源紧追才有更多计算资源投入。在 DeepSeek 之后，原本计划不再发新模型的 OpenAI 接连发出 o3mini，并计划继续发布 o3，还考虑开源模型。Anthropic 和 Google 也会加快 RL 的研究。行业对新范式的推进因为 DeepSeek 加快，中小团队也可以在不同的 domain 上尝试 RL。

另外，reasoning model 的提升会进一步帮助 agent 落地，AI researcher 现在都因此对 agent 的研究和探索更有信心，因此也可以说 DeepSeek 开源 reasoning model 推进了行业向 Agent 的进一步探索。

---------------

关注公众号“星河AI观测站”，领取DeepSeek及AI学习资料~