一文读懂2025核心概念 AI Agent：科技巨头都在布局的未来赛道（DeepSeek只是开始，AI Agent更是未来！）

最新推荐文章于 2025-11-18 14:41:32 发布

原创最新推荐文章于 2025-11-18 14:41:32 发布 · 1.2k 阅读

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #prompt #microsoft #产品经理 #大模型 #语言模型

2024年人工智能大模型技术发展后，2025年初，黄仁勋、奥特曼、吴恩达等科技大佬频繁提及AI Agent，微软、谷歌、腾讯等企业也强调其为2025年最值得关注的人工智能技术，将2025年视为AI Agent元年。对此，人工智能爱好者难免好奇：什么是AI Agent？ 它有哪些表现形式与关键技术？本文将结合吴恩达在Build 2024的演讲，通俗讲解AI Agent。

1、 AI Agent 与大模型的区别

目前使用的DeepSeek、千问等均属于大模型，其任务执行流程十分简单：用户提问后，模型直接生成回答，全程仅涉及用户与模型本身。例如编写文案时：

倘若由AI Agent来创作一篇文案，它将采取怎样的步骤呢？其具体的处理流程大致如下：

首先运用模型构建文案大纲
接着依据大纲搜索相关资料
随后对收集到的资料以及已产出的内容进行归纳总结
再利用相同或不同的模型对内容进行评估
最后依据评估结果不断优化完善，直至达到既定要求后输出最终文案。

可想而知，经过以上设计处理的文案输出效果明显好于单一大模型输出的。然后大家再想想我们人类是如何写文案的？看看AI Agent的处理是不是和人类特别相似。

通过以上例子相信大家能直观感受到AI Agent和大模型的区别。通俗易懂的讲：AI Agent是一个包含一个或多个大模型，具备一定编排，和人类直观行为更相辅的复杂系统。 更简单来说，AI Agent就是将大模型作为处理部件，编排类人处理流程的系统。

2、AI Agent分类

机器学习大佬吴恩达曾在演讲中将AI Agent分为如下四类：

2.1、反思系统 Reflecttion

定义： 一种通过自我反思方式，帮助模型不断改进输出质量的编排系统。这种方法模仿了人类在完成任务时的思考和修正过程，使得模型推理能力更强，结果更可靠。

举例： 这种编排系统特别适合输出高质量的文案,比如我们上面提到的AI Agent编写文案的例子就是这种反思系统的模式。著名的国外平台：Grammarly 就是利用了编排系统，调用强大的AI大模型进行写作，同时它不断反思检查你的拼写、语法和标点符号，通过多模型提供的句子结构和语言流畅性的建议进一步优化输出更好的效果。

2.2、工具调用系统 Tool Use

定义： 让大语言模型在生成答案或解决问题的过程中，调用外部工具（如计算器、数据库、搜索引擎等），以完成自身无法直接处理的任务。

举例： 现在的大语言模型更多的只是文本的生成和回答，工具调用系统可以通过调用工具弥补大语言模型的不足，扩展模型的功能。使用的Vs Code 插件 Cline+Continue 相当于代码编程领域的AI Agent，通过调用各类工具完成文件创建，代码编写检查，代码调试运行等一系列的功能。将DeepSeek大模型的能力扩展到了编程领域。

2.3、计划系统 Planning

定义： 模型在解决复杂问题时，为实现目标制定合理的步骤或行动计划的能力。让大模型在面对复杂任务时，能像人一样制定计划、分解问题、逐步执行。

举例： Image Describer X图片描述网站在处理我们图片时会使用模型制定计划，如果我们想输入一张小女孩读书的图片并进行描述，Image Describer X会进行如下行为：

调用openpose model提取小女孩读书的动作
调用Google Vit模型把动作转化为图片
调用Vit-GPT2模型把图片转成文字
调用fast speech模型把文字转成语音

这种AI Agent就像我们人类一样把大问题拆分成小问题，并制定计划解决。它更贴近真实智能的行为，可以处理广泛复杂任务。

2.4、 Multi-Cast Multi Agent 系统

定义： 最复杂的Agent系统，利用了多个Agent智能体，在共同目标的指导下，通过分工、协作和交互来完成任务或解决问题的过程。

举例： 2023年7月，清华大学 NLP 实验室联合面壁智能、北京邮电大学、布朗大学的研究人员共同发布了一个大模型驱动的全流程自动化软件开发框架 ChatDev (Chat-powered Software Development)，加入 OpenBMB 大模型工具体系。ChatDev 是一个由多智能体协作运营的虚拟软件公司，在人类“用户”指定一个具体的任务需求后，不同角色的智能体将进行交互式协同，包括产品智能体设计方案，UI智能体设计界面，程序员智能体实现效果，测试智能体评估代码来生产一个完整软件（包括源代码、环境依赖说明书、用户手册等），直观上来说这种机制和软件公司并无两样，也是多智能体Agent系统的表达形式之一。

3、科技公司AI Agent的探索

AI Agent的概念如此重要，各科技公司也对它展开了积极的探索，推出了一些实际或理想的产品。下面简单列举国内外各大公司在Agent领域的项目：

腾讯：腾讯元器开放的智能体模式就是AI Agent的典型应用，大家可以通过外部插件（tool use), 大模型流程编排(planning)等方法构建智能体，大家也是施展聪明才智构建了包括PPT助手，育儿助手等各种各样的智能体，大家可以体验一下~

谷歌：2024年5月，谷歌就发布了一个震撼的AGI系统 Astra将AI Agent的能力集中在手机摄像头上，通过手机的摄像头让Astra对所有听到、看到的东西进行解读。可以点击扬声器、画笔、代码让其解释用途和含义，是典型的Multi Agent 多智能体应用。

总结

经过以上的分享，大家都直观感受到了AI Agent的重要意义。人工智能的发展道路基本可分为如下三步：AI->AI Agent->AGI。DeepSeek，Qwen等强力大模型的出现为AI Agent提供了良好的模型基础，使其可以构建更大更强的智能体系统。AI Agent的发展又让AGI（通用人工智能，旨在创造一个能像人类一样思考、学习、执行多种任务的系统）的美好愿景逐渐成为现实，未来的世界一定是人工智能的世界！

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】