OpenAI重新开源！深夜连发两个推理模型，o4-mini水平，笔记本、手机可跑

原创于 2025-08-06 14:48:14 发布 · 227 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#开源 #深度学习 #人工智能 #机器学习

终于，OpenAI 的新发布还是来了。

虽然不是我们期待已久的 GPT-5，但也是「something big-but-small today.」

也就是开源新语言模型。

要知道，这是近几年来（自 GPT-2 以来），OpenAI 重新开源模型。

据在 OpenAI 任职研究科学家的清华校友翁家翌透露，从 2022 年 OpenAI 内部就讨论模型开源，并曾数次接近「开源」目的，但直到今天才实现。

GitHub 地址：https://github.com/openai/gpt-oss
hugging face 地址：https://huggingface.co/openai/gpt-oss-20b
hugging face 地址：https://huggingface.co/openai/gpt-oss-120b
博客地址：https://openai.com/index/introducing-gpt-oss/

Sam Altman 声称，gpt-oss 性能与 o4-mini 水平相当，并且可以在高端笔记本电脑上运行（WTF！！）（还有一个较小的可以在手机上运行）。

总结一波，这两个开源模型的亮点包括：

宽松的 Apache 2.0 许可证：自由构建，不受版权限制或专利风险 - 非常适合实验、定制和商业部署。
可调整的推理力度：根据具体用例和延迟需求轻松调整推理力度（低、中、高）。
完整的思维链（CoT）：完全可访问模型的推理过程，从而更轻松地进行调试并增强对输出的信任。不计划向终端用户展示。
可微调：通过参数微调，完全可根据特定用例定制模型。
Agentic 功能：使用模型的功能进行函数调用、网页浏览、Python 代码执行和结构化输出。
原生 MXFP4 量化：模型使用原生 MXFP4 精度针对 MoE 层进行训练，使得 gpt-oss-120b 可在单个 H100 GPU 上运行，gpt-oss-20b 模型可在 16GB 内存内运行。

OpenAI 还做了一个 playground ，让开发者可以在网页端简单尝试这两个开源模型，感兴趣的读者可以去体验尝试

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。