GPT-5:革命性突破,还是被过度炒作的失望之作?互联网难下定论

在这里插入图片描述

2025年8月标志着近来最具争议的 AI 发布之一

当 OpenAI 在 2025 年 8 月 8 日推出 GPT-5 时,科技界已做好准备迎接又一次分水岭式的时刻。CEO 山姆·奥特曼(Sam Altman)承诺它将是一位“真正的博士级专家”,相比之下 GPT-3 仅相当于“高中生”水平,并将“专家级智能带给每个人”。但随着数字尘埃落定,网络舆论却对 GPT-5 是否兑现了这些宏大承诺意见分歧。

支持者:“这将改变一切”

真正可用的代码能力

对于开发者而言,GPT-5 似乎确实是个颠覆者。该模型在编程基准测试中创下纪录:

  • SWE-bench Verified 得分 74.9%(上一代为 69.1%)
  • Aider Polyglot 多语言代码编辑测试得分 88%

但超越数据的是实践体验,让一些用户真心激动。沃顿商学院教授伊桑·莫里克(Ethan Mollick)惊叹于 GPT-5 能从一个模糊的提示中自主创建“程序化粗野主义建筑生成器”,并在几分钟内交付一个“可拖放”的 3D 城市建造器。

最令早期用户印象深刻的是 GPT-5 摆脱了其他 AI 编程助手备受诟病的“错误循环”——一位评测者指出:“有时 AI 会引入新的错误,但只要把错误文本粘回去,它总能修复。”相比之前反复调试的折磨,这是一大进步。

Alpha 测试者盛赞

获得模型扩展访问权限的 Alpha 测试者中,最热情的评价来自流行 AI 编程平台 Cursor,其称 GPT-5 为“我们使用过的最聪明的编程模型”,并称其“智能非凡、易于引导”,能巧妙捕捉“那些深藏的棘手漏洞”。

在代码审查任务中,GPT-5 在 Qodo 的 PR 基准测试中取得了 72.2 分,经常是“唯一能发现如安全漏洞或导致编译失败的重大问题”的模型。

怀疑者:“皇帝的新衣”

Reddit 抗议与用户反弹

但每有一份赞誉,就有同样热烈的批评。在 ChatGPT 子版块,一篇题为 “GPT-5 糟透了” 的高赞帖子获得近 3 000 个赞和超过 1 200 条评论,失望的用户声讨不断。

吐槽点出奇一致:回答更短、帮助性下降、“令人厌烦的 AI 风格口吻”、减少了个性,以及让尊贵用户在一小时内就撞上使用上限的烦人限制。

老问题依旧存在

也许对 GPT-5 声誉更具杀伤力的是,它仍在用户寄予厚望的基础任务上跌跤。尽管号称“博士级”,用户依然报告以下问题:

  • 基础数学:2025 年还犯简单计算错误,令人难以接受
  • 事实准确性:持续的幻觉、捏造细节、信息错误
  • 拼写与语法:在基础语言任务上出乎意料地失误

本特利大学数学副教授诺亚·吉安西拉库萨(Noah Giansiracusa)总结道:“我觉得这次发布令人失望。虽然有所改进,但远没有我期望的那么显著。”

个性化问题

最令人触动的批评来自于对 ChatGPT 特色声音的哀叹。以往版本对话感人而生动,很多人觉得 GPT-5 变得冷冰冰、毫无人情味。

“曾经让 ChatGPT 显得‘像个人’的个性没了,”
一位用户感慨,“曾经机智又温暖,现在像一份生硬的企业备忘录。”
还有人形容它是“一个过劳的秘书”,有人称“真心为失去 4.0 而哀悼,就像失去了朋友。”

期望陷阱

过度承诺,未达预期?

这场两极分化的反应,或许与 GPT-5 的实际能力关系不大,而更源于 OpenAI 的营销狂轰滥炸。当你承诺“按需超能力”和“专家级智能”,任何不堪称奇迹的表现都难免让人失望。

资深 AI 研究者兼批评家加里·马库斯(Gary Marcus)精准点评:“GPT-5:迟到、炒作过度且令人失望,而且这还不是最糟的。”单看标题,就道出了期待与现实的巨大反差。

技术阵痛

更雪上加霜的是,GPT-5 采用了全新模型切换机制:根据查询复杂度自动在不同变体间切换。理论上这能优化资源,但也让用户无从得知自己用的到底是哪一个版本。

奥特曼也承认了最初的技术故障:“自动切换器挂了好一阵子,导致 GPT-5 那段时间显得特别蠢。”在高调发布时出现基础设施问题,只会加剧用户的不满。

结论:复杂的现实

不同用户,不同模型

GPT-5 的褒贬分歧揭示了 AI 应用中的有趣现象:不同用户有着截然不同的需求和期望。对处理复杂编码任务的开发者而言,GPT-5 的基准提升和更少错误率是真正进步;其多轮对话能力、捕捉细微 bug 和大量可用代码输出,任何标准下都可称得上令人印象深刻。

而对寻求对话伙伴的普通用户来说,GPT-5 更正式、更企业化的语气反而显得倒退。他们重视版本间的个性与温度,远超过冰冷的技术指标。

炒作周期的现实考验

GPT-5 的反馈也提醒我们 AI 炒作周期的无情。每一次新模型的发布,都要超越前作的功能,更要满足那月余期待中不断膨胀的想象。

《麻省理工科技评论》或许最贴切地总结道:GPT-5 “首先是更精致的产品”,能带来“更愉悦、更流畅的使用体验”,但“远不及奥特曼大肆渲染的变革性 AI 未来”。

展望未来

GPT-5 是进步还是停滞,或许取决于后续发展,而不只是模型本身。这次分裂的反馈表明,我们正进入一个阶段:技术上的渐进改进,无论多么技术性地令人惊叹,都难以再激发人们对“突破性时刻”的狂热。

对 OpenAI 而言,挑战不仅在于打造更好的模型,还要在一个“昨日的奇迹成为今日基础”的行业里,管理好大众的期望。正如一位推特用户所言:“人们习惯于期待奇迹,可 GPT-5 只是最新的渐进式升级。”


你怎么看 GPT-5?体验到它的编码提升,还是感受到它的个性流失?随着更多人上手,争论仍在继续。

英文原文

gpt-5

AI好书推荐

AI日新月异,再不学来不及了。但是万丈高楼拔地起,离不开良好的基础。您是否有兴趣了解人工智能的原理和实践? 不要再观望! 我们关于 AI 原则和实践的书是任何想要深入了解 AI 世界的人的完美资源。 由该领域的领先专家撰写,这本综合指南涵盖了从机器学习的基础知识到构建智能系统的高级技术的所有内容。 无论您是初学者还是经验丰富的 AI 从业者,本书都能满足您的需求。 那为什么还要等呢?

人工智能原理与实践 全面涵盖人工智能和数据科学各个重要体系经典

北大出版社,人工智能原理与实践 人工智能和数据科学从入门到精通 详解机器学习深度学习算法原理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值