DeepSeek系列模型的多模态发展历程如下:
-
首次多模态版本
- DeepSeek VL(2024年3月11日):作为首个开源视觉-语言(VL)模型,标志着DeepSeek正式进入多模态领域。
-
后续多模态升级
- DeepSeek VL2(2024年12月13日):采用专家混合架构(MoE),显著提升了视觉理解能力。
- Janus-Pro(2025年1月28日):全新多模态大模型,支持文生图等跨模态任务。
- DeepSeek-R1(2025年1月20日):融合模态穿透技术,通过多模态训练反哺文本推理能力,评测表现超越GPT-4o。
总结:DeepSeek从2024年3月发布的DeepSeek VL版本开始成为多模态大模型,后续通过VL2、Janus-Pro、DeepSeek-R1等版本持续强化多模态能力。