DeepSeek是什么
- DeepSeek发展历程
- DeepSeek的平台应用
- Ollama本地部署DeepSeek
1)发展历程
DeepSeek是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式AI模型。
2023年7月成立杭州
2023年11月2日,发布首个开源大模型DeepSeek coder.
2023年11月29日,发布DeepSeek LLM通用大模型,参数规模达670亿
2024年5月7日,发布二代开源模型DeepSeek V2,总参数2360亿,推理成本降至每百万TOKEN仅1元
2024年12月26日,发布开源模型DeepSeek V3,总参数达6710亿,采用创新的混合专家架构(MoE)和FP8 混合精度训练,训练成本仅为557.6万美元。
2025年1月20日,发布新一代推理模型DeepSeek R1,性能与OpenAI的o1正式版持平且开源
2025年1月26日,DeepSeek登顶美区App store免费榜第六。
2025年1月27日,除夕,DeepSeek Janus-Pro开源发布多模态模型,既要进行视觉理解,又要进行图像生成,并在多个排行中霸榜。
2) 平台应用
代码改写 | 对代码进行修改,重构、纠错、注释、解释、调优 |
角色扮演 | 情景续写,提供一个场景,让模型模拟场景下的对话 |
文字创作 | 诗歌、文案类文字创作 |
翻译 | 对用户输入内容进行翻译 |
提示词生成 | 根据用户需求,帮助生成高质量提示词 |