自然语言处理: 第九章DeepSpeed的实践
DeepSpeed的RLHF模块:一站式深度学习训练与优化
于 2023-08-21 08:52:14 首次发布
本文介绍了DeepSpeed的RLHF模块,一个端到端的深度学习框架,用于简化大规模训练和推理。它包括监督微调、奖励模型微调和RLHF训练,以及EMA和混合训练技术,旨在提升模型质量和预训练性能。同时,DeepSpeed支持多数据集训练和多种部署选项,如单GPU和多节点训练。

![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jy4c1ZHS-1691735368213)(image/09_DeepSpeed/1691662528184.png)]](https://i-blog.csdnimg.cn/blog_migrate/8c46840f471aef02f814274dc1875a67.png)
最低0.47元/天 解锁文章
1114

被折叠的 条评论
为什么被折叠?



