1.3GPT和DS模型介绍
1GPT技术
2017Google的Transformer
2018年0.1B的GPT1
- Decode-only Transformer
2019年1.5B的GPT2
- 任务统一为单次预测;尝试规模扩展
2020年175B的GPT3
- 上下文学习能力
2021年代码预训练的CodeX,搜索能力的WebGPT
- 推理和代码合成能力
- 使用浏览器
2022年人类对齐的InstructGPT,对话能力的ChatGPT
- 人类价值观对齐;RLHF算法
- 面向对话优化
2023年多模态&推理能力的GPT4
- 推理能力显著提升
- 支持多模态
2024年深度思考能力o1
- 长思维链推理能力
2025年深度思考能力o3
2DeepSeek技术
2023年HAI-LLM训练框架:支持多种并行策略
2024年1月DS LLM:数学清洗
2024年1月DS Coder:代码能力
2024年2月DS Math:数学能力;GRPO
- 基于PPO改进算法GRPO:群组相对策略优化
2024年3月 DS-VL:多模态
2024年5月 DS-V2:MoE;MLA
- MLA多头潜在注意力机制
- MoE混合专家模型
2024年6月 DS Coder-V2
2024年12月 DS V3:671BMoE;MLA,MTP
- 高效的FP8训练方法
- MTP:多token预测范式