OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑

终于,OpenAI 的新发布还是来了。

虽然不是我们期待已久的 GPT-5,但也是「something big-but-small today.」

也就是开源新语言模型。

要知道,这是近几年来(自 GPT-2 以来),OpenAI 重新开源模型。

据在 OpenAI 任职研究科学家的清华校友翁家翌透露,从 2022 年 OpenAI 内部就讨论模型开源,并曾数次接近「开源」目的,但直到今天才实现。

  • GitHub 地址:https://github.com/openai/gpt-oss

  • hugging face 地址:https://huggingface.co/openai/gpt-oss-20b

  • hugging face 地址:https://huggingface.co/openai/gpt-oss-120b

  • 博客地址:https://openai.com/index/introducing-gpt-oss/

Sam Altman 声称,gpt-oss 性能与 o4-mini 水平相当,并且可以在高端笔记本电脑上运行(WTF!!)(还有一个较小的可以在手机上运行)。

总结一波,这两个开源模型的亮点包括:

  • 宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 - 非常适合实验、定制和商业部署。

  • 可调整的推理力度:根据具体用例和延迟需求轻松调整推理力度(低、中、高)。

  • 完整的思维链(CoT):完全可访问模型的推理过程,从而更轻松地进行调试并增强对输出的信任。不计划向终端用户展示。

  • 可微调:通过参数微调,完全可根据特定用例定制模型。

  • Agentic 功能:使用模型的功能进行函数调用、网页浏览、Python 代码执行和结构化输出。

  • 原生 MXFP4 量化:模型使用原生 MXFP4 精度针对 MoE 层进行训练,使得 gpt-oss-120b 可在单个 H100 GPU 上运行,gpt-oss-20b 模型可在 16GB 内存内运行。

OpenAI 还做了一个 playground ,让开发者可以在网页端简单尝试这两个开源模型,感兴趣的读者可以去体验尝试

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值