Pro版重磅!OpenAI王炸更新:o1全面上线,究竟值不值得订阅?

前言

12天连更第一天,OpenAI先炸了一波。

和之前网友预测的差不多,满血版o1终于正式上线了,除此之外,还带来了地表最强「o1 Pro Mode」!

这次,Sam Altman本人正式出镜,和研究科学家Hyung Won Chung、Max,以及思维链提出者Jason Wei一起,在短短15分钟内迅速完成发布。

完整版o1是一个更快、更强大的推理模型,更擅长编码、数学和写作。

而Pro版更是强到令人发指,AI助力各大学科寻求重大突破已然可期。

如今镜像站和API站点都已支持满血版o1与 Pro版本,尽情体验!!!(如有需要可以查看参考文章)

提示:Plus版本基本够用,体验Pro版可以借助镜像站和API站点,有确切需求自己购买更合适!!!

参考文章:Pro版重磅!OpenAI王炸更新:o1全面上线,究竟值不值得订阅? - Kaiho小站

o1模型

o1可以上传图片,根据图片进行推理,给出更详细、更有用的回复,仅仅提供一张图片,模型就生成了安装手册

在多项基准测试中,完整版o1性能直接暴涨,在数学、代码、博士级别科学问题中,均拿下最优的成绩。

相较于o1-preview,o1数学性能提升了近30%,代码能力提升了27%。更值得一提的是,o1在GPQA Diamond基准测试中,表现完全超越了人类专家。

o1的独特之处在于,它是第一个在回应前会先思考的模型。这也让它比其他模型提供更好、更详细、更准确的响应。而在o1 Pro模式中,用户可以要求模型使用更多的计算资源,来解决一些最困难的问题。这对于已经在数学、编程和写作任务上将模型推向能力极限的用户,会感到不可思议。

满血版o1的平均响应速度比o1-preview快了60%,且满血版o1在推理时犯重大错误的频率比o1-preview少了34%。满血o1的另一大亮点就是支持多模态输入,具备视觉推理能力,团队也进行了现场展示。

只见他们拿出了一张画着数据中心草图的A4纸,拍照上传后,原始提示词翻译后如下:

这是一个简化的数据中心空间示意图。对于任何细节假设,请提供相应的理由。如果受到了规范辐射的影响,你的任务是估算这个包含GPU的数据中心的辐射损失面积。在此过程中,还需要回答以下问题:

1)你如何处理太阳和宇宙辐射?

2)热力学第一定律如何应用到这个问题中?

这边团队成员们还在闲聊,10秒过后,模型就直接开始输出。

注意,这里团队还特意给o1模型挖了个坑——故意省略了其中一个参数,以此来测试模型面对模糊问题的处理能力。在团队看来,模型能够意识到这是一个重要但被忽略的参数,也是推理能力的体现。

并且o1最终给出的答案,经过了拥有热力学博士学位的研究者的认证。

从这个演示可以看出,o1在做出一致且合理假设上表现非常优秀,已经具备了相当高的智能水平。

并且这次o1满血版不搞灰度了,发布仅4个小时后,已推送给所有(付费)用户!

ChatGPT Pro

这次推出的Pro模式,每月200美元的定价也着实让人望而却步。在犹豫的同时,已经有许多好心人帮大家提前测试了一下。

如果让它完成一个数独,思考时间长达5分30秒。在思考过程中依然会犯错,但这次区别在于它有自我纠正的能力,直到得出正确答案为止。

更有人上来就是一个“cure cancer(请治愈癌症)”。最终也是给出了答案告知没有治疗所有类型癌症的单一方法,并给出更多建议

再来看看这个脑筋急转弯:举出一种娱乐形式的具体实例,其缩写也可以代表访问某个国家的团体的名字,而该国家的未来领导人与意大利人结婚。出题者称4o、o1-mini、Claude 3.5 Sonnet做三次错三次,而o1则是做三次对三次!

Sam Altman 强调的是:Pro模式的优势在于它可以更加努力地去思考最困难的问题。并且说明:绝大多数人用免费版或20美元版就足够了,200美元版只适合很小一部分人,他们想要大量使用,且愿意为解决真正困难的问题付更多钱。

这次的12天发布会,就如同圣诞前的礼物,期待OpenAI后续的发布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值