微软开源 Deep Speed Chat

微软推出了开源项目DeepSpeedChat,该工具基于DeepSpeed库,能高效训练和推理大语言模型,如ChatGPT,使用RLHF技术提升训练效率15倍以上并降低成本。此外,文章还提及Meta在VR领域的高薪招聘以及商汤发布的“商量”语言模型,以及上海一位00后用AI技术引发的争议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ac925b5cf296fac92064957eb556266f.gif

4月12日,微软宣布开源了 Deep Speed Chat,帮助用户轻松训练类 ChatGPT 等大语言模型。

Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

16a5d87183c3315eb3ba20ce5c279028.gif

☞大裁员之后,Meta 为 VR 程序员开出百万美元年薪!
☞商汤加入 ChatGPT 战局,发布“商量”语言大模型!
☞上海 00 后小伙 AI “复活”奶奶,却引发巨大争议
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值