摘要:2025 年 8 月,本应是 OpenAI 再次震惊世界的时刻,但 GPT-5 的发布却像一颗投入深潭的石子,激起的涟漪远非预期的“革命性”浪潮,反而是对“AI 进步是否已达瓶颈”、“缩放定律是否依然有效”的广泛质疑。本文将深度剖析 GPT-5 的实际表现、行业观点的转变,以及这场技术“减速”可能对未来 AI 经济格局带来的深远影响。
一、期望越大,失望越大:GPT-5 的“平庸”首秀
在经历了长达两年多的期待后,GPT-5 终于揭开面纱。然而,无论是专业评测还是社区反馈,都指向了一个令人不安的结论:GPT-5 的进步是渐进式的,而非颠覆性的。
知名 YouTube 科技博主 Mrwhosetheboss 的深度实测直观地揭示了 GPT-5 令人困惑的双面性:
-
亮点有限:在特定逻辑密集型任务上,如从零开始编写一个完整的象棋游戏,GPT-5 的表现确实优于轻量级的 GPT-4o-mini-high;在内容创作层面,它撰写视频脚本的能力也强于 GPT-4o。一个值得称道的工程优化是,GPT-5 具备了根据用户任务自动匹配并调用最优模型的“路由”能力。
-
短板明显:然而,在更多用户日常可感知的场景中,GPT-5 却不尽如人意。无论是生成 YouTube 视频缩略图,还是设计生日派对邀请函,其效果均未能超越前代 GPT-4o。更令人警惕的是,评测显示 GPT-5 似乎更容易被诱导“一本正经地胡说八道”,即编造事实。
这份“喜忧参半”的答卷迅速在付费用户群体中引发了负面情绪,部分用户甚至给出了“垃圾”的直白评价。
人工智能领域的权威学者 Gary Marcus 的评论则更为深刻,他直言 GPT-5 是“过度炒作且令人失望的”。他指出,如果说 2023 年 GPT-4 相较于 GPT-3 是一次“从 0 到 1”的飞跃,那么 GPT-5 的提升则更像是“从 1 到 1.1”,仅仅停留在“基准测试分数更高、文字表达更流畅”的细节打磨上,并未展现出任何突破性的新能力。
二、从“造车”到“修车”:大模型研发范式的悄然转变

行业内曾有一个经典比喻:预训练大模型如同“制造一辆全新的汽车”,而后续的微调与优化则是“对现有汽车进行改装升级”。在过去数年,以 OpenAI 为首的 AI 巨头们,正是通过不断扩大预训练的规模(即投入更多数据和算力),来持续“生产”出性能更强劲的“新款汽车”。
但 GPT-5 的发布,似乎标志着这条“造车”之路的速度已大幅放缓。
早在 2024 年春季,OpenAI CEO Sam Altman 还曾向内部工程师许下“下一代模型将远超 GPT-4”的豪言壮语。然而,一年多后落地的 GPT-5 显然未能完全兑现这一承诺。
这种“停滞感”也得到了学术界的佐证。亚利桑那州立大学的研究人员指出,当前大模型所展示的所谓“推理能力”,其本质上是一种“脆弱的幻影”(a fragile phantom)。这种能力高度依赖于其训练数据的边界,一旦遇到训练数据范围之外的真实世界问题,便会迅速失效。这从根本上解释了为什么基准测试的高分,无法直接等同于解决现实复杂问题的泛化能力。
Gary Marcus 的观察一针见血:“2025 年的大模型也许在跑分上更高,但没有哪家 AI 公司敢站出来说,它的产品比 2024 年的版本‘实用得多’。”
行业的风向正在改变。工程师们的重心,正从“如何构建更庞大的模型”转向“如何更高效地优化、应用和修复现有模型”。整个行业的角色,也正从“汽车制造商”悄然向“汽车修理工”过渡。
三、缩放定律的黄昏:AI 发展的“第一性原理”失效了?
在过去很长一段时间里,“缩放定律”(Scaling Laws)被整个 AI 行业奉为圭臬。这一理论由 OpenAI 在 2020 年的论文中正式提出,其核心逻辑简单而粗暴:只要模型参数、数据量和计算量三者协同增长,模型的性能就会持续、可预测地提升。
从 GPT-2 到 GPT-3 的百倍规模跃迁,再到 GPT-4 技惊四座的表现,每一次迭代似乎都在完美印证着缩放定律的魔力。在 ChatGPT 用户破亿的狂热氛围中,风险资本如潮水般涌入,Sam Altman 甚至在《万物的摩尔定律》一文中,描绘了 AGI(通用人工智能)触手可及的未来。
然而,质疑声从未远去。纽约大学教授 Gary Marcus 多年来一直坚持认为,“缩放定律只是一种经验性的观测结果,而非放之四海而皆准的物理规律”。尽管这一观点曾遭到 Yann LeCun、马斯克等行业大佬的反驳,他本人也因此被视为“异类”。
如今,GPT-5 的平淡表现,让天平开始向怀疑者倾斜。正如 TechCrunch 所评论的,行业内已经形成一种普遍共识:单纯依靠堆砌算力和数据,并不能让大模型进化成无所不知的“数字神灵”。
自 GPT-4 发布至今已超过两年,OpenAI 再未能推出一款真正具有划时代意义的模型。“缩放定律失效”的论调,正从少数人的预警,演变为越来越多从业者的共识。
四、寒气传导至资本:当万亿美梦遭遇现实
如果缩放定律这条增长捷径真的走到尽头,其连锁反应将首先冲击建立在“无限增长”预期之上的 AI 经济。
科技分析师 Ed Zitron 和 Gary Marcus 对此观点一致:他们认为,生成式 AI 的市场规模远没有此前炒作的“万亿级别”那般庞大,一个更现实的估值区间可能在 500 亿至 1000 亿美元。
这对未来的技术和市场意味着:
-
AI 工具的进步将是稳定但缓慢的:它们会被更广泛地应用于特定领域,但其能力边界将更加清晰,短期内不会对就业市场造成颠覆性冲击。
-
AGI 的实现将变得更加遥远和不切实际:依赖暴力计算通往 AGI 的道路,可能从一开始就是错误的。
更直接的风险,潜藏在资本市场。当前美国股市中,高达 35% 的市值集中在七大科技巨头身上。在过去 18 个月里,这些企业在 AI 领域的总投入高达惊人的 5600 亿美元,但其直接相关的 AI 收入却仅有 350 亿美元。
这种“高投入、低回报”的剪刀差如果持续扩大,一旦市场对 AI 的增长预期进行修正,其引发的连锁反应将不堪设想。
五、结语:十字路口的 AI,路在何方?
当然,唱衰并非唯一的声音。从乐观的角度看,GPT-5 带来的“冷静期”或许是行业回归理性的必要一步。当“大力出奇迹”的路径受阻,反而会倒逼整个行业去探索更复杂、更高效的解决方案。
未来的技术突破,可能不再源于模型规模的指数级增长,而是来自于:
-
更高效的算法与模型架构
-
对数据质量的极致追求
-
多模态融合与世界模型的深入探索
-
AI 与物理世界(如机器人)的更紧密结合
AI 的发展正站在一个新的十字路口。告别了野蛮生长的“大跃进”时代,前方或许是一条更艰难,但也可能通往真正智能的道路。从“规模驱动”转向“效率与创新驱动”,这或许是 GPT-5 带给我们的最大启示。

被折叠的 条评论
为什么被折叠?



