在人工智能快速发展的今天,OpenAI再次引领了技术前沿的讨论。最近,OpenAI首席科学家Jakub Pachocki和首席研究官Mark Chen在a16z的播客中深入探讨了GPT-5的发布、强化学习的持续成功,以及他们对未来"自动化研究员"的宏伟愿景。这次对话不仅揭示了当前AI技术的突破性进展,更为我们描绘了一个从"氛围编程"走向"氛围研究"的未来图景。
GPT-5:推理能力的主流化
融合即时响应与长时推理
GPT-5的发布标志着OpenAI在AI推理能力方面的重要里程碑。正如Pachocki所解释的,GPT-5是OpenAI将推理能力带入主流的尝试。在此之前,OpenAI拥有两个不同的模型系列:GPT-2、3、4系列提供即时响应,而O系列则能够进行长时间思考后给出最佳答案。
GPT-5的核心创新在于解决了用户的选择困难——不再需要纠结于使用哪种模式。通过大量研究,团队确定了针对不同提示的最佳思考时间,并将这种痛点从用户身上移除。这种"智能化的推理时间分配"代表了AI系统在用户体验优化方面的重要进步。
超越传统评估基准
在评估AI进展方面,传统的基准测试已经接近饱和。Chen指出,许多过去几年使用的评估标准已经接近98-99%的准确率上限。更重要的是,随着强化学习在特定领域的深度训练,模型可以在某些任务上达到极高性能,但这并不意味着更强的泛化能力。
团队现在更关注的是模型发现新事物的实际标志。特别是在数学和编程竞赛中的表现,成为了衡量进展的最令人兴奋的指标。然而,即便是这些评估也在趋于饱和,因此下一代评估将聚焦于实际发现和经济相关的真实进展。
强化学习:持续超越预期的技术
为什么强化学习如此有效?
强化学习的持续成功令许多人感到意外。每当有人预测RL会遇到瓶颈时,OpenAI总是能够推出新的改进版本。Pachocki解释了这种成功


最低0.47元/天 解锁文章
760

被折叠的 条评论
为什么被折叠?



