2 Deepseek保姆级教程_DeepSeek是什么

最新推荐文章于 2025-02-12 11:32:41 发布

陈布衣

最新推荐文章于 2025-02-12 11:32:41 发布

阅读量287

点赞数 2

分类专栏： AI大模型文章标签：人工智能 ai

本文链接：https://blog.youkuaiyun.com/qq_33169644/article/details/145556909

版权

5 篇文章

订阅专栏

DeepSeek是什么

1）发展历程

DeepSeek是一家由中国知名量化私募巨头幻方量化创立的人工智能公司，致力于开发高效、高性能的生成式AI模型。

2023年7月成立杭州

2023年11月2日，发布首个开源大模型DeepSeek coder.

2023年11月29日，发布DeepSeek LLM通用大模型，参数规模达670亿

2024年5月7日，发布二代开源模型DeepSeek V2，总参数2360亿，推理成本降至每百万TOKEN仅1元

2024年12月26日，发布开源模型DeepSeek V3，总参数达6710亿，采用创新的混合专家架构(MoE)和FP8 混合精度训练，训练成本仅为557.6万美元。

2025年1月20日，发布新一代推理模型DeepSeek R1，性能与OpenAI的o1正式版持平且开源

2025年1月26日，DeepSeek登顶美区App store免费榜第六。

2025年1月27日，除夕，DeepSeek Janus-Pro开源发布多模态模型，既要进行视觉理解，又要进行图像生成，并在多个排行中霸榜。

2) 平台应用