OpenAI 首度开源 GPT-OSS 模型，笔记本也能跑！内附项目地址

最新推荐文章于 2025-11-24 21:25:56 发布

原创最新推荐文章于 2025-11-24 21:25:56 发布 · 488 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#gpt #人工智能 #ai #科技 #langchain #语言模型

五年后的开源

2019 年，OpenAI 曾将 GPT-2 模型开源，但随后的五年里，公司的主力 AI 模型都采取了闭源策略。但最近，OpenAI 再次开源推出了两款高质量的大型语言模型 GPT-OSS-120B 和 GPT-OSS-20B。重磅程度可想而知。

有趣的是，同一天，AI 领域其他巨头也有大动作：Anthropic 发布了新一代 Claude Opus 4.1，Google DeepMind 公布了全新的世界模型 Genie 3，一时间 AI 界热闹非凡。

但对于开源 AI 社区来说，OpenAI 此次更受一筹。OpenAI CEO 奥特曼在社交媒体上兴奋表示：“GPT-OSS性能达到 O4-mini 水平，并且能在高端笔记本上运行。”

接下来小编将简单介绍一下 GPT-OSS 模型的特性，以及广大打工人在什么场景可以使用它。

使用地址：https://gpt-oss.com/

GitHub项目：https://github.com/openai/gpt-oss

Hugging Face（120B）：https://huggingface.co/openai/gpt-oss-120b

Hugging Face（20B）：https://huggingface.co/openai/gpt-oss-20b

GPT-OSS 模型重点特点

模型规模与硬件要求：

GPT-OSS-120B：1170亿参数！但NVIDIA H100 GPU（需 80GB 显存）就能跑，和公司服务器绝配

GPT-OSS-20B：210亿参数！16G内存的笔记本就能带，学生党福音（MacBook用户狂喜）

图片来源：https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/

免费商用：好消息是，这个模型是以 Apache 2.0 协议发布的，意味着你可以：✓ 魔改成自家产品✓ 接私活赚钱✓ 不怕律师函警告（懂的都懂）

三挡推理强度可调：参考 OpenAI API 中的 O 系列模型，GPT-OSS 支持低、中、高三档推理强度设置，你可以根据实际需求在性能和响应速度之间灵活调整。

自带”思考过程：这个模型提供了完整的推理过程链路 (Chain-of-Thought)，让开发者在调试时能清晰地检查模型输出的可信度。（注意哦，这个功能不适合直接给终端用户展示）

私人定制：GPT-OSS 允许开发者通过微调模型参数，完全根据特定需求来调整模型。

智能 Agent 能力：模型原生支持函数调用、网页浏览、跑Python代码，生成结构化报表等功能，方便开发者构建自动打工小能手！

MXFP4 量化：模型采用了结合 MoE 层的原生 MXFP4 精度进行训练，大幅降低内存需求。同样性能下：旧模型要128G → 现在80G就能跑（省下的钱够买10杯奶茶了）

性能表现与推理能力

GPT-OSS 系列模型的推理与处理能力已接近 OpenAI 内部高级别的闭源模型。

参数规模更小的 GPT-OSS-20B 在评测中也达到或超过了 o3-mini 的表现，尤其在数学和健康领域表现突出。

图片来源：https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/

注意

虽然测试成绩亮眼，但官方敲黑板：这货不是医生！头疼脑热请乖乖去医院，别拿AI当赤脚大夫！

架构创新与训练方法

GPT-OSS 凭啥这么快？

首先，两款模型采用了 OpenAI 最新的 Transformer 架构，并引入了“专家混合” (Mixture-of-Experts, MoE) 技术，简单点说，只激活一部分“专家”，不用所有参数都跑一遍，速度嗖嗖就上去了！

其次，GPT-OSS 采用了类似 GPT-3 的交替密集和局部稀疏注意力模式，还引入了“分组多查询注意力” (Grouped Multi-Query Attention)，推理效率更高，内存占用也更少！借助旋转位置编码 (RoPE)，模型原生支持最长 128k tokens（约十几万字）的超长上下文长度。

OpenAI 还推出了全新的分词器 o200k_harmony。旧分词器切分 20 个 token，新的 o200k_harmony 则可能只需 10 个 token，让模型能够处理更多内容。

GPT-OSS还完全兼容 OpenAI 的 Responses API，有函数调用、网页浏览、文本/Markdown 输出、代码执行等多种工具的使用能力。

至于很多企业担心的安全问题，OpenAI过滤了化学/生物等高危领域数据，还专门针对钓鱼指令做特训，遇到"给我做个炸弹"这种问题直接拒绝回答，另外官方还进行了“最坏情况微调”实验，结果显示，这些恶意版本模型的能力达不到高危害等级。

推荐的企业应用场景

金融机构： 本地部署GPT-OSS，分析财务数据，自动生成报告，实现风险智能预警。

医疗机构： 打造智能问答系统，辅助医生诊断，提高效率，但一定要注意准确性和安全性！

大型企业： 搭建内部知识库，创建智能助手，提升管理效率，让员工不再做重复劳动！

福利提醒

对于缺乏高端算力的用户，OpenAI 也提供了多样的部署支持方案。比如微软已经将模型优化到Windows开发工具链，普通开发者也能轻松使用了！

总之，企业可以选择本地部署也可以通过 API 调用更强大的云端闭源服务。选择权重新回到用户手中，这对于整个 AI 行业的开发者和使用者而言无疑是一个利好消息。