终于,OpenAI 的新发布还是来了。
虽然不是我们期待已久的 GPT-5,但也是「something big-but-small today.」
也就是开源新语言模型。
要知道,这是近几年来(自 GPT-2 以来),OpenAI 重新开源模型。
据在 OpenAI 任职研究科学家的清华校友翁家翌透露,从 2022 年 OpenAI 内部就讨论模型开源,并曾数次接近「开源」目的,但直到今天才实现。
-
GitHub 地址:https://github.com/openai/gpt-oss
-
hugging face 地址:https://huggingface.co/openai/gpt-oss-20b
-
hugging face 地址:https://huggingface.co/openai/gpt-oss-120b
-
博客地址:https://openai.com/index/introducing-gpt-oss/
Sam Altman 声称,gpt-oss 性能与 o4-mini 水平相当,并且可以在高端笔记本电脑上运行(WTF!!)(还有一个较小的可以在手机上运行)。
总结一波,这两个开源模型的亮点包括:
-
宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 - 非常适合实验、定制和商业部署。
-
可调整的推理力度:根据具体用例和延迟需求轻松调整推理力度(低、中、高)。
-
完整的思维链(CoT):完全可访问模型的推理过程,从而更轻松地进行调试并增强对输出的信任。不计划向终端用户展示。
-
可微调:通过参数微调,完全可根据特定用例定制模型。
-
Agentic 功能:使用模型的功能进行函数调用、网页浏览、Python 代码执行和结构化输出。
-
原生 MXFP4 量化:模型使用原生 MXFP4 精度针对 MoE 层进行训练,使得 gpt-oss-120b 可在单个 H100 GPU 上运行,gpt-oss-20b 模型可在 16GB 内存内运行。
OpenAI 还做了一个 playground ,让开发者可以在网页端简单尝试这两个开源模型,感兴趣的读者可以去体验尝试

被折叠的 条评论
为什么被折叠?



