我花了 200 美元购买 ChatGPT Pro——是捡漏还是巨坑?

OpenAI 2024 年“ shipmas ”的第一期今天发布。随着更新的到来,ChatGPT 订阅产品的首次升级:ChatGPT Pro。200美元的价格令人难以置信,仅针对最先进的 ChatGPT 用户。

最大的问题是:它真的值得吗?

我在这里为您解答这个问题。

细节

使用 GPT Pro 可以获得以下功能:

  • 使用 4o、o1 和 o1-mini 进行无限制聊天
  • 无限高级语音模式
  • 访问 GPT o1-Pro(每周限制 50 条消息)
  • 所有型号均具有完整的 128k 令牌上下文窗口(常规订阅为 32k)

…是的。就是这样。

当我第一次听到这个消息时,我的想法和你现在的想法是一样的。这怎么可能值得花这么多钱呢?

虽然可以无限扩展地访问其他型号很棒,但在我看来,这一切都取决于 GPT o1-Pro 的性能。如果它真的比普通的 o1 好很多,那可能就值得了。这就是我测试它的原因。

GPT o1-专业版

ChatGPT Pro 配备了前沿 AI 模型 o1-Pro,这是真正的 LLM 最新成果。问题是,它有多好?

根据 OpenAI 的说法,它比 o1 或 o1-preview(以及目前所有其他 LLM)更加智能、更加一致:

一些 LLM 基准测试结果显示,o1-Pro 相较于 o1 预览版有显著改进。来源: https: //openai.com/index/introducing-chatgpt-pro/

我没有时间对这个模型进行真正的考验,但我做了一些有趣的测试,尝试将其推向极限。

o1-Pro 测试 1:转换整个应用程序

我的第一个任务很大。我把我的一个Django应用程序的全部代码交给了 o1-Pro,并要求它将整个应用程序转换为Flask 框架

这是 GPT-4o 根本无法开始做的事情(因为一次要处理的事情太多了),几天前当我尝试时,o1-preview 严重失败了这项任务。

这个应用程序需要考虑很多事情,比如数据库、身份验证系统和 Stripe 集成,更不用说其中的所有 AI 组件。

然而,o1-Pro表现出色,经过长时间的调试后,能够​​输出分步转换指南,并包含每个元素的书面代码!

以下是一组截图,显示了这项任务有多么艰巨。不过,它的表现非常出色!

o1-Pro 测试 2 — 读取模拟时钟

你可能会惊讶地发现,即使是GPT-o1也无法读取模拟时钟的图像:

彻底失败了。

然而,o1-Pro经过更深入的思考,得出了接近正确的结论:

仍不正确,但是正在接近正确!

这项测试尚无定论,但仍然很有趣。是否有一个秘密的新视觉模型在后台为 o1-Pro 提供更好的数据?也许……

o1-Pro 测试 3 —密码测试

最后,我创建了一个密码测试来测试 4o、o1 和 o1-Pro 的纯逻辑强度。这是一个简单的凯撒密码,但为了让事情变得更难一些,我从移位中删除了一些字母(i、o 和其他一些字母)。这意味着简单的字母移位测试不起作用,因此需要逻辑操作来测试更多潜在的解决方案。

输入的密文如下:

我不太确定这个模型能否破解密码,因为这里没有足够的文本来真正得到有意义的答案。不过,我可能是错的!

以下是经过密码加密后的文本:

我 ar sox wo wyvj xmax xmiw rohjq 气体 woqbj gitmjv,fjgaywj xmjvj wirtqe iws'x jsoylm xjdx mjvj xo agxyaqe ljx a rjasislkyq aswcjv。 Mocjbjv,我 goyqh fj cvosl!

结果:

GPT-4o彻底失败了,无法给出连贯的回应。

然而,GPT-o1表现相当出色,其最终解码的答案是:

我不太确定这个模型能否破解密码,因为这里没有足够的文本来真正得到合理的答案。不过,我认为它是有效的!

它已经非常接近了,但是还是无法弄清楚一些部分。

令人惊讶的是,GPT-o1-Pro在这次测试中表现实际上更差,其最终答案是:

我不太确定这个密码是否能证明一个理论,无论如何,这里并没有足够的意义来充分得出合理的结论。不过,我认为它是有效的!

有点失望,但是试了好几次,还是没能超越o1。

经过所有这些测试后,很难说o1-Pro是否明显优于o1。不过,我打算对此进行深入研究(提供更多实际用例),看看它是否更适合日常使用。

如果您考虑升级只是为了访问o1-Pro,那么我不会这么做。

最终裁决

那么,您应该升级到 GPT-Pro 吗?

在我看来,除非您是 ChatGPT 的真正重度用户,并且它确实能产生收入来抵消其成本,否则您应该坚持使用普通的旧 Plus 会员资格。

以下是您可能想要升级的几个原因,否则我不会推荐它:

  • 您喜欢高级语音模式并且希望花更多时间使用它
  • 你确实需要为所有模型提供 128k 上下文窗口(如果你编写长篇内容,这一点很重要)
  • 你不断达到每周 50 条消息的限制(这对我来说是一场巨大的斗争)

总的来说,如果您每天使用 ChatGPT 的时间不大于 1-2 小时,那么多花 180 美元是不值得的。

虽然由于消息数量有无限限制,我会保留我的订阅,但我不能说这对大多数人来说是个好主意。

感谢阅读!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

牛马尼格

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值