大语言模型LLMBook-3

1.3GPT和DS模型介绍

1GPT技术

2017Google的Transformer

2018年0.1B的GPT1

  • Decode-only Transformer

2019年1.5B的GPT2

  • 任务统一为单次预测;尝试规模扩展

2020年175B的GPT3

  • 上下文学习能力

2021年代码预训练的CodeX,搜索能力的WebGPT

  • 推理和代码合成能力
  • 使用浏览器

2022年人类对齐的InstructGPT,对话能力的ChatGPT

  • 人类价值观对齐;RLHF算法
  • 面向对话优化

2023年多模态&推理能力的GPT4

  • 推理能力显著提升
  • 支持多模态

2024年深度思考能力o1

  • 长思维链推理能力

2025年深度思考能力o3

2DeepSeek技术

2023年HAI-LLM训练框架:支持多种并行策略

2024年1月DS LLM:数学清洗

2024年1月DS Coder:代码能力

2024年2月DS Math:数学能力;GRPO

  • 基于PPO改进算法GRPO:群组相对策略优化

2024年3月 DS-VL:多模态

2024年5月 DS-V2:MoE;MLA

  • MLA多头潜在注意力机制
  • MoE混合专家模型

2024年6月 DS Coder-V2

2024年12月 DS V3:671BMoE;MLA,MTP

  • 高效的FP8训练方法
  • MTP:多token预测范式

2025年 DS R1:长思维链

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值