大模型后训练(post-training-of-llms)
文章平均质量分 90
大模型后训练,post-training-of-llms
Ethanwhh
再见少年拉满弓,不惧岁月不惧风。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型后训练——总结
大模型后训练——总结原创 2025-08-28 17:28:43 · 437 阅读 · 0 评论 -
大模型后训练——Online-RL实践
大模型后训练——Online-RL实践原创 2025-08-28 09:43:31 · 843 阅读 · 0 评论 -
大模型后训练——Online-RL基础
大模型后训练——Online-RL基础原创 2025-08-06 17:13:45 · 966 阅读 · 0 评论 -
大模型后训练——DPO实践
大模型后训练——DPO实践原创 2025-07-22 22:32:30 · 1398 阅读 · 0 评论 -
大模型后训练——DPO基础
大模型后训练——DPO基础原创 2025-07-22 14:22:48 · 756 阅读 · 0 评论 -
大模型后训练——SFT实践
大模型后训练——SFT实践原创 2025-07-21 20:00:23 · 1252 阅读 · 0 评论 -
大模型后训练——SFT基础
大模型后训练——SFT基础原创 2025-07-21 09:23:58 · 612 阅读 · 0 评论 -
大模型后训练——大模型后训练介绍
大模型后训练——大模型后训练介绍原创 2025-07-20 11:54:22 · 626 阅读 · 0 评论
分享