OpenAI高调宣布,推理最强模型o3 pro发布,硬刚Gemini 2.5 Pro 0605,国内直接使用

在这里插入图片描述

在这里插入图片描述

OpenAI连放大招,先把o3价格暴降80%,又官宣上线史上最强推理模型o3 pro。

🗓️ 发布时间

o3 pro于2025年6月10日正式发布,目前已向ChatGPT Pro和Team用户开放,企业和教育用户将在一周后获得访问权限。

🚀 o3 pro到底有多厉害?

o3 pro是OpenAI迄今为止最强大的AI模型,专门设计用来处理那些需要深度思考和高准确性的复杂问题。

它不像普通AI那样快速回答,而是会"花大约10倍的时间来思考"(有时需要几分钟),但给出的答案质量完全不同。

在这里插入图片描述
用户只是简单说了个"Hi",o3 pro竟然思考了3分54秒才回复!

花80美元回复一个"Hi"看似夸张,但这反映了o3-pro调用了大量计算资源。它不像普通模型那样"随便回答",而是动用最高级别的推理能力。这就像用顶级跑车去买菜,杀鸡用牛刀,但保证了绝对的可靠性。

国内直接使用o3 pro

在这里插入图片描述

无需魔法、不需要国外邮箱、不需要绑定信用卡、不需要20美元/月。

使用地址:www.nezhasoft.cloud

还包含了ChatGPT4o、o4-mini-high、o3、GPT4.5、GPT4.1、Gemini 2.5 Pro 0605、Claude Sonnet 4、DeepSeek R1 0528、Grok3 thinking等模型。
在这里插入图片描述

🚀 核心提升

1、基准测试表现突出

编程能力:在Codeforces编程竞赛中获得2727的Elo评分,超过了OpenAI首席科学家的2665分

数学能力:在AIME 2024数学测试中,o3 pro的表现优于谷歌的顶级AI模型Gemini 2.5 Pro。

科学知识:在GPQA Diamond(博士级科学知识测试)中击败了Anthropic最新发布的Claude 4 Opus。

2、推理能力大幅增强

o3 pro是首个能够直接使用工具的推理模型,采用了"模拟推理"技术,能够在回答前暂停并反思自己的思考过程。

在专家评估中,评审员在科学、教育、编程、商业和写作帮助等关键领域都一致偏爱o3 pro而非o3。

3、全面的工具使用能力

O3-pro 可以访问工具,允许它搜索网页、分析文件、对视觉输入进行推理、使用 Python、利用记忆个性化响应等。这意味着它不仅仅是回答问题,还能主动使用各种工具来解决复杂任务。

🎯 核心特点

1、深度思考模式

o3-pro的一个显著特点是模型的响应通常比 o1-pro 需要更长时间完成。这是因为它会进行更深入的推理和分析,确保给出的答案更加准确可靠。

2、更智能的工具选择

它在辨别环境方面明显更好;准确地传达它可以访问哪些工具,何时询问外部世界的问题(而不是假装它有信息/访问权限),并为工作选择正确的工具。

3、战略性思维能力

o3 Pro 是第一个能给我提供可以直接带给创始人或高管的观点的模型。它在战略上足够敏锐(通过适当的提示),不需要进一步润色就能开始关于重大决策的对话。

在这里插入图片描述

💰 定价和可用性

1、API定价:

  • 输入:每百万tokens 20美元
  • 输出:每百万tokens 80美元
  • 相比o1-pro便宜了87%

2、用户访问:

o3-pro 从周二开始可供 ChatGPT Pro 和 Team 用户使用,取代 o1-pro 模型。企业和教育用户将在之后一周获得访问权限

⚠️ 当前限制

1、o3-pro 的临时聊天目前已禁用,OpenAI 正在解决"技术问题"

2、o3-pro 无法生成图像

3、Canvas(OpenAI 的 AI 驱动工作区功能)不支持 o3-pro

o3-pro代表了AI推理能力的又一次重大飞跃,特别是在需要深度思考和高准确性的专业领域表现出色。虽然响应速度较慢,但对于那些重视质量胜过速度的复杂任务来说,这是一个理想的选择。

一句话搞定一个需求

1、写作

全国一:

阅读下面的材料,根据要求写作。(60分)

他想要给孩子们唱上一段,可是心里直翻腾,开不了口。 ——老舍《鼓书艺人》(见全国一卷阅读II)

假如我是一只鸟,我也应该用嘶哑的喉咙歌唱 ——艾青《我爱这土地》

我要以带血的手和你们一一拥抱,因为一个民族已经起来 ——穆旦《赞美》

以上材料引发了你怎样的联想和思考?

请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

你觉得这个水平能得多少分?有兴趣的可以在评论区留言探讨。

在这里插入图片描述

2、编程

用户在秒杀页面疯狂点击“立即购买”,系统必须高效且线程安全地减少商品库存,防止超卖。如何在高并发场景下安全扣减库存?

在这里插入图片描述

3、直接“喂食”《大型分布式网站架构设计与实践》.pdf技术书籍

几十万字的学术论文、技术书籍、毕业设计、项目资料都能直接"喂进去",让Gemini 2.5 pro快速总结、归纳、优化、降低论文查重率,写作效率提升数倍。

根据文档内容,围绕“分布式网站架构设计”,总结一份学术论文大纲。

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

哪 吒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值