2023年初OpenAI用ChatGPT-4点燃了AI革命的导火索,全球科技界在惊叹与焦虑中仓促迎战。而今年以来,随着DeepSeek以黑马姿态破圈,通用大模型的混战终于显现出清晰的格局。随之而来的,一个更本质的问题浮出水面:在褪去概念光环之后,AI究竟能在多少真实场景中扎根生长?这场从"技术爆炸"到"价值沉淀"的转向,正在重新划定行业竞争的起跑线。大家将目光转向了 AI Agent。
前排提示,文末有大模型AGI-优快云独家资料包哦!
AI Agent 要素模型
什么是 AI Agent?从一张图说起。
关注 AI 领域的人可能对这张图都不陌生了,这幅图对于 AI Agent 的定义和解释,来源于 Open AI 团队早期核心成员之一的 Lilian Weng 于 2023 年 6 月发表的一篇文章“LLM Powered Autonomous Agents”。文章除了提出这个框架,还分别对 Planning,Memory,Tools 这几个要素做了详细论述。而这几个要素也是区分这轮 AI 浪潮中 AI Agent与AI 大模型,或者传统应用软件的重要衡量因素。
这篇文章发表之后的两年里,无论是 AI Agent 在实践领域方面的探索,还是各种科普研究,都取得了快速且显著的进展,因此关于 AI Agent 的这几个核心概念也不再陌生。
Planning (规划)- 规划是 AI 大模型推理能力最直接的体现,也是最能让用户直观体验 AI Agent 与一般应用不同之处的“超能力”。通常认为,具备规划能力的 Agent 能够将用户交付的任务有效地分解为若干子任务,规划执行子任务的流程,更厉害的是,在执行任务的过程中,agent 还能对执行情况进行思考和判断。
Memory (记忆) - 分为短记忆和长记忆,短记忆主要用于上下文学习,而长记忆则要向外部数据库检索。
Tools(工具) - Lilian Weng 的文章中提到,使用工具是人类区别于其它物种的一个重要特征,AI Agent 能够通过对多种工具进行调用来完成相对复杂的系列任务。
再用一个公式总结一下:
● AI Agent = LLM(大语言模型 +Planning(规划)+Memory(记忆)+Tools(工具)
AI Agent 的分类方式
虽然很多应用都被归为AI Agent,但不同的Agent自动化等级也是被讨论比较多的一个问题。目前普遍认为,自动化程度从低到高大约可以分为几个阶段,最初级的以人机语言交互为主要模式,可以参考具有对话能力的聊天机器人;再往上一层是co-pilot (副驾)模式,这个等级的 Agent 还是以用户的助理角色出现;而自动化的更高等级是智能体模式,这种模式还分为“受限的智能体”和“完全智能体”。这里引用一张图来大致说明一下这几种模式的区别。
回到实际的商业场景,AI Agent 又可以分为两大类:通用 Agent和面向垂直领域的 Agent。到 2025 年上半年,这两个类别里已经涌现了不少具有代表性的 Agent 产品。前者比如说Anthropic 推出的 Computer Use,智谱的AutoGLM以及今年年初横空出世的黑马产品Manus。而面向垂直领域的 Agent 几乎可以说是百花齐放,比较热门的领域包括办公、编程、法律、教育、营销、金融、客服等。目前推出通用型 Agent 的国内外的科技巨头占主流,而定位垂直赛道的 Agent 背后大公司和创业团队同样活跃。
MCP
2024 年 11 月,Anthropic 发布了 MCP(Model Context Protocol),用于不同AI 系统、模型和模块中高效共享环境、状态和上下文。有人曾打过比方,MCP 就好像 AI 世界的转接头,与 API 模式相比,开发者无需再对接多个服务接口,大大降低了数据调用、通信格式等方面的成本和难度。特别是,2025 年 3 月,Open AI 宣布支持 MCP 协议,更加推动了 AI 开发者生态的繁荣。
结语
今年AI Agent可太火了,我做投资的朋友甚至说感觉热度快赶上 2021 年前后的 SaaS 了。虽然吧,这个类比不太吉利,但 AI Agent 的前沿动态确实值得持续跟踪学习。横向来看,AI Agent是连接大模型与用户的高效桥梁;纵向而言,它有望全面革新并升级基于信息时代和互联网时代构建的软件与系统架构。所以从这里开始,我会从不同角度通过多篇文章跟大家分享这个领域的学习心得,同时也期待得到你们的反馈,共同进步。我们下期见。
读者福利:倘若大家对大模型感兴趣,那么这套大模型学习资料一定对你有用
针对0基础小白:
如果你是零基础小白,快速入门大模型是可行的。
大模型学习流程较短,学习内容全面,需要理论与实践结合
学习计划和方向能根据资料进行归纳总结
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
这里我们能提供零基础学习书籍和视频。作为最快捷也是最有效的方式之一,跟着老师的思路,由浅入深,从理论到实操,其实大模型并不难。
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓