OpenAI 首度开源 GPT-OSS 模型,笔记本也能跑!内附项目地址

五年后的开源

2019 年,OpenAI 曾将 GPT-2 模型开源,但随后的五年里,公司的主力 AI 模型都采取了闭源策略。但最近,OpenAI 再次开源推出了两款高质量的大型语言模型 GPT-OSS-120B  GPT-OSS-20B。重磅程度可想而知。

有趣的是,同一天,AI 领域其他巨头也有大动作:Anthropic 发布了新一代 Claude Opus 4.1,Google DeepMind 公布了全新的世界模型 Genie 3,一时间 AI 界热闹非凡。

但对于开源 AI 社区来说,OpenAI 此次更受一筹。OpenAI CEO 奥特曼在社交媒体上兴奋表示:“GPT-OSS性能达到 O4-mini 水平,并且能在高端笔记本上运行。”

接下来小编将简单介绍一下 GPT-OSS 模型的特性,以及广大打工人在什么场景可以使用它。

使用地址:https://gpt-oss.com/

GitHub项目:https://github.com/openai/gpt-oss

Hugging Face(120B):https://huggingface.co/openai/gpt-oss-120b

Hugging Face(20B):https://huggingface.co/openai/gpt-oss-20b

GPT-OSS 模型重点特点

模型规模与硬件要求:

GPT-OSS-120B:1170亿参数!但NVIDIA H100 GPU(需 80GB 显存)就能跑,和公司服务器绝配

GPT-OSS-20B:210亿参数!16G内存的笔记本就能带,学生党福音(MacBook用户狂喜)

图片来源:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/

免费商用:好消息是,这个模型是以 Apache 2.0 协议发布的,意味着你可以:✓ 魔改成自家产品✓ 接私活赚钱✓ 不怕律师函警告(懂的都懂)

三挡推理强度可调:参考 OpenAI API 中的 O 系列模型,GPT-OSS 支持三档推理强度设置,你可以根据实际需求在性能和响应速度之间灵活调整。

自带”思考过程:这个模型提供了完整的推理过程链路 (Chain-of-Thought),让开发者在调试时能清晰地检查模型输出的可信度。(注意哦,这个功能不适合直接给终端用户展示)

私人定制:GPT-OSS 允许开发者通过微调模型参数,完全根据特定需求来调整模型。

智能 Agent 能力:模型原生支持函数调用、网页浏览、跑Python代码,生成结构化报表等功能,方便开发者构建自动打工小能手!

MXFP4 量化:模型采用了结合 MoE 层的原生 MXFP4 精度进行训练,大幅降低内存需求。同样性能下:旧模型要128G → 现在80G就能跑(省下的钱够买10杯奶茶了)

性能表现与推理能力

GPT-OSS 系列模型的推理与处理能力已接近 OpenAI 内部高级别的闭源模型。

参数规模更小的 GPT-OSS-20B 在评测中也达到或超过了 o3-mini 的表现,尤其在数学和健康领域表现突出。

图片来源:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/

注意

虽然测试成绩亮眼,但官方敲黑板:这货不是医生! 头疼脑热请乖乖去医院,别拿AI当赤脚大夫!

架构创新与训练方法

GPT-OSS 凭啥这么快?

首先,两款模型采用了 OpenAI 最新的 Transformer 架构,并引入了“专家混合” (Mixture-of-Experts, MoE) 技术,简单点说,只激活一部分“专家”,不用所有参数都跑一遍,速度嗖嗖就上去了!

其次,GPT-OSS 采用了类似 GPT-3 的交替密集和局部稀疏注意力模式,还引入了“分组多查询注意力” (Grouped Multi-Query Attention),推理效率更高,内存占用也更少!借助旋转位置编码 (RoPE),模型原生支持最长 128k tokens(约十几万字)的超长上下文长度。

OpenAI 还推出了全新的分词器 o200k_harmony。旧分词器切分 20 个 token,新的 o200k_harmony 则可能只需 10 个 token,让模型能够处理更多内容。

GPT-OSS还完全兼容 OpenAI 的 Responses API,有函数调用、网页浏览、文本/Markdown 输出、代码执行等多种工具的使用能力。

至于很多企业担心的安全问题,OpenAI过滤了化学/生物等高危领域数据,还专门针对钓鱼指令做特训,遇到"给我做个炸弹"这种问题直接拒绝回答,另外官方还进行了“最坏情况微调”实验,结果显示,这些恶意版本模型的能力达不到高危害等级。

推荐的企业应用场景

金融机构: 本地部署GPT-OSS,分析财务数据,自动生成报告,实现风险智能预警。

医疗机构: 打造智能问答系统,辅助医生诊断,提高效率,但一定要注意准确性和安全性!

大型企业: 搭建内部知识库,创建智能助手,提升管理效率,让员工不再做重复劳动!

福利提醒

对于缺乏高端算力的用户,OpenAI 也提供了多样的部署支持方案。比如微软已经将模型优化到Windows开发工具链,普通开发者也能轻松使用了!

总之,企业可以选择本地部署也可以通过 API 调用更强大的云端闭源服务。选择权重新回到用户手中,这对于整个 AI 行业的开发者和使用者而言无疑是一个利好消息。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值