
4月12日,微软宣布开源了 Deep Speed Chat,帮助用户轻松训练类 ChatGPT 等大语言模型。
Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

☞大裁员之后,Meta 为 VR 程序员开出百万美元年薪!
☞商汤加入 ChatGPT 战局,发布“商量”语言大模型!
☞上海 00 后小伙 AI “复活”奶奶,却引发巨大争议
微软推出了开源项目DeepSpeedChat,该工具基于DeepSpeed库,能高效训练和推理大语言模型,如ChatGPT,使用RLHF技术提升训练效率15倍以上并降低成本。此外,文章还提及Meta在VR领域的高薪招聘以及商汤发布的“商量”语言模型,以及上海一位00后用AI技术引发的争议。
1335

被折叠的 条评论
为什么被折叠?



