OpenAI 发布新 Agent！推荐几本大模型开发经典图书！

转载于 2025-07-18 20:00:00 发布 · 42 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MjM5Njc0MjIwMA==&mid=2649836699&idx=1&sn=1ec82115c99f48b2a30754c49f902aa9&chksm=bff168a4f967c14371c762beb386e8b5f3c41fd989c99f8a0df1f024bd969cbda65d4e6c9a66&scene=126&sessionid=0

文章标签：

#chatgpt #人工智能

OpenAI 又上新了！

推出全新智能体“ChatGPT Agent”，全面进军自动化 AI 代理领域。

如果你觉得以前的 ChatGPT 只是会说话，那这次它彻底从嘴替变成了行动派，它可以查资料、点击页面、填表、写代码、做 PPT，甚至帮你总结竞争对手的报告，真正把想法变成行动这句话落到了实处。

这背后，是 ChatGPT 首次把自家三大王牌能力整合在了一起：

Operator（具备浏览网页、点击操作能力）
Deep Research（擅长多步骤推理和网络信息综合分析）
ChatGPT（强大的语言理解与生成能力）

简单说，它现在成了一个能上网、会分析、擅表达、懂协作的 AI 搭子。

最直观的变化是：以前你得自己点网页、复制数据、开 Excel 或 PPT；现在只要一句话，Agent 就能帮你自动完成整个流程。

虽说这次更新更像是“整合+打包”，不是革命性突破，毕竟国内不少智能体产品早就有类似功能。但从执行质量看，它还是有亮点的。

虽然写 PPT 的表现还不够精细，跟国内一些工具比还有差距，但做策略方案、自动比价、下单等复杂流程，它的效率和准确度都很可圈可点。

很多人担心，AI 自己跑去操作网页，是不是不太可控？

别担心，它在设计时就考虑到了人类的安全感：

每一步关键操作前，它会征求你的同意
你可以随时中止、修改、接管它正在做的事情
运行过程中会实时在屏幕上展示它正在执行的步骤，操作透明可控

你就像坐在副驾上，AI 开车，但方向盘你随时能接过来。

ChatGPT Agent 在各种评测中的表现也很惊人：

在模拟投行分析师的财务建模任务中，Agent 模型比人类还准，超过 GPT-4o 的表现。
在处理 Excel 电子表格的任务上，Agent 的正确率达到 45.5%，是 GPT-4o 的两倍以上，甚至已经可以和 Copilot 一较高下。
在 WebArena 等真实浏览任务中，Agent 表现比旧版 Operator 驱动的模型更强，接近人类水平。
在 BrowseComp 基准上，Agent 成绩达到了 68.9%。

简单说：它不仅能干活，还干得更快、更准。

现在 Plus 用户可以直接在 ChatGPT 工具栏里开启 Agent 模式，动动嘴，让它帮你跑流程、做报告、写文档，工作效率立刻飞起。

如果你也想了解大模型背后的技术原理，推荐下面这几本大模型相关的实用好书！

重磅新书预告

《这就是 AI 智能体》

张梓铭（@北茗）| 著

本书从多个角度全面介绍基于大模型的智能体技术，内容涵盖基础知识、发展历史、技术架构、应用场景、未来趋势及项目实践，旨在为读者提供一站式学习资源。书中不仅有深入浅出的理论讲解，还包含丰富的实战项目示例，帮助读者从零开始，逐步掌握 AI 智能体的核心技术与应用技能，同时培养创新思维和实际操作能力。

《这就是MCP》

艾逗笔（@idoubi）| 著

本书全面介绍了 MCP 协议及其应用开发，从基础概念到实战案例，再到生态系统构建，为读者提供了一套完整的 MCP 学习与实践指南。

第 1 章概述 MCP 的基本概念，阐述其独特优势及应用场景；第 2 章深入解析MCP的核心架构、通信基础、传输机制及资源管理等技术细节；第 3 章和第 4 章通过多个实战案例，详细讲解了 MCP 服务器和客户端的开发流程，包括高效记笔记、总结聊天记录、复刻AI助手等应用；第 5 章展示了 MCP 在行程规划、RAG 和深度研究等领域的经典应用案例；第 6 章探讨了 MCP 工具链、平台服务、生态整合及社区资源，展望其未来发展。

大模型实用教程