AI Agent代表AI发展的新阶段,具备环境感知、自主决策与行动执行能力,是"主驾驶"而非"副驾驶"。其核心能力包括独立思考规划、自主使用工具和记忆迭代。文章详细解析了Agent与Chatbot的区别、六大应用模式、产业链布局及市场前景,指出Agent将从"生成内容"向"解决复杂问题"转变,成为AI大模型时代的超级入口。2025年中国企业级AI Agent市场规模预计达232亿元,未来增长潜力巨大。
一、智能体Agent 基础知识复盘
1、定义
AI Agent(智能体)是一种具备环境感知、自主决策与行动执行能力的人工智能系统。
Agent是一个系统,其核心能力架构包含四个关键维度:
① 感知能力(Perception)–解析、 理解环境信息与用户输入、进行知识推理、生成文本;
② 规划能力(Planning)–制定目标导向的任务策路;
③行动能力(Action/ToolUse)–调用工具或API执行操作;
④ 记忆能力(Memory)–存储并关联历史交互与知识。
一言以蔽之:Agent =大模型+规划能力+记忆能力+行动能力!
2、Agent与 Chatbot区别:
Chatbot是人类完成绝大部分工作,类似于向AI询问意见,了解信息,AI提供信息和建议,但不直接处理工作;而Agent能独立处理工作。
Agent与Copilot 区别在于“自主规划” 的能力:Copilot 的模式需要人的指挥;而Agent则是直接面对目标任务,具有自主记忆、推理、规划和执行的全自动能力。Copilot 是“副驾驶”,只是提供建议而非决策,而Al Agent 是“主驾驶”需要真正做出决策并开展行动。

大模型是Al Agent的核心驱动力与智能基础,Agent是大模型应用的最高形态,赋予A高度自主性,使其能够独立分解任务、规划步骤并调用工具完成目标。Agent模式下AI不仅是“助手”,更是具备闭环执行能力的“智能代理人”。
3、Agent 三大核心能力
不是所有AI模型都是Agent,关键在于"工具调用能力”,即主动调用外部工具以拓展能力边界、达成复杂目标的能力,实现了从“解答问题”到“解决问题”的跨越。
一个合格的Al Agent ,需具备三个核心能力:
1)独立思考和规划: Al Agent 不需要人干涉,独立思考,将复杂任务分解成一系列子步骤,能够根据给定任务目标和约束条件,进行任务规划和问题拆解,形成执行步骤(即工作流);
(2)自主使用工具来执行:能够调取各类组件和工具,按照执行步骤依次执行,实现任务目标;
(3)记忆并持续迭代:记忆,既有短期记忆存储即时信息,又有长期记忆沉淀持久知识, Al Agent能够自动记录任务目标、工作流和执行结果,基于结果反馈,沉淀专家知识和案例。

4、Agent是AGI的第三个阶段
OpenAI将通用人工智能AGI的发展分为了五个阶段,用于描述AGI从低级到高级、从简单到复杂的路径。
第一阶段:聊天机器人–Chatbots**,这一阶段的AI能够进行基本的对话,翻译、摘要等,但缺乏深度推理能力类似于之前的ChatGPT;**
第二阶段:推理者–Reasoners;在这一阶段够以人类专家的水平解决复杂推理和决策的问题,如医疗诊断、金融风险评估,OpenAI的o1、o3、DeepSeek R1也是这个阶段的推理大模型;
第三阶段:智能体–Agents,处于验室向商业化过渡阶段,可自主完成“思考 - 决策 - 执行”闭环,这一阶段包括,自动驾驶和机器人控制等,能够实现自主决策和行动;
第四阶段:创新者–Innovators,尚在探索中,AI系统具有创造性和独创性,像AlphaFold助力蛋白质结构预测那样,可辅助人类在科研、艺术等领域实现突破性发明与创作;****
第五阶段:组织者–Organizations,是AGI终极形态,目前未实现,系统不仅具备战略思维,还拥有高效率和强适应性,能够管理复杂的系统,承担组织和管理的工作。
如果说AI在前三阶段还是人类的助手的话,到第四阶段就已经成为人类的合作者,到第五阶段简直就可以去驱使人类了。
从目前的人工智能发展阶段来看,第五级的重大意义在于,人工智能不仅可以作为单个个体开展工作,还可以相互协作、组织成为一个公司,人工智能的作用可以成千上万倍放大,实现规模化运作。
5、 Agent的六大模式(2025年)

(1)Agentic RAG(推理型检索增强生成)
Agentic RAG 是一种融合检索增强(RAG)、智能规划(Agent)、工具调用(Tools)、和可持续上下文(Memory)的多步推理架构,使大模型能够执行复杂任务,而不仅是回答问题。
Agentic RAG = RAG(检索) + Agent(规划) + Tools(执行) + Memory(上下文)→ 让大模型从“回答问题”升级为“完成任务”。
国内的代表是:① 百度文心一言 + 搜索增强:结合百度搜索做事实检索;② 360纳米搜索:整合360搜索的即时信息流。
(2)Voice Agents(语音智能体)
**Voice Agent 是指基于语音交互的人机智能体系统,结合 ASR、**NLU、任务规划与执行以及 TTS 技术,实现从语音输入到任务完成再到语音输出的全链路闭环。
Voice Agent简单来说,就是一个「能说话的智能体」——用户开口说话,它理解、回应、执行,一切都像在和人交谈。
代表案例是:① OpenAI GPT-4o Voice:多模态对话,低延迟语音交互;② 字节的豆包:强实时语音识别与合成;③ 小米的小爱同学:深度嵌入IoT生态等。
(3)CUA(像人类一样使用电脑的代理)
CUA,全称Computer Using Agents,AI能够像人类一样点鼠标、敲键盘、操作计算机,它不再是“顾问”,而是“数字实习生”。
CUA实现从“理解指令”到“执行操作”的闭环能力。其核心是整合视觉感知、任务规划和物理操作三大能力,通过屏幕截图获取视觉信息,基于多模态大模型推理分解任务步骤,最终控制鼠标、键盘等输入设备完成操作。
主要应用场景是:自动化办公、桌面软件操作、RPA(机器人流程自动化)。
目前的代表例子是:① MultiOn:能代替用户操作网页、表格、日历等;②字节跳动的 扣子空间:低代码构建多场景桌面操;③ Fellou:网页与桌面操作的自动化执行。

(4)Coding Agents( 代码智能体)
Coding Agents是一种专门用于编程任务的智能体,它能够在软件开发过程中根据环境中的工具,执行相应的操作,去辅助用户做一些功能,如代码生成、调试、优化等。
Coding Agents程序员的“代码搭档”,核心是“让编程更高效”。
代表案例是:① GitHub Copilot Workspace:支持从需求到部署的全链路编码;② 阿里的通义灵码:嵌入IDE的代码生成与调试;③ 百度Comate:结合文心大模型的智能编程工具。
(5) Deep Research Agents(深度研究型智能体)
Deep Research系统最能体现AI智能体在科研领域的潜力与局限。这类系统采用多智能体架构,能够在几分钟内整合和分析数百个信息源,生成带有准确引用的综合研究报告。
当面对一个研究问题时,主控智能体会将其拆分为多个子任务,调度不同的智能体分别搜集和分析资料,最后再把各部分成果汇总成一份结构完整、逻辑连贯的报告。
代表案例是:① OpenAI Deep Research(2025新功能):多Agent长期调研;② 阿里千问深度研究:针对行业报告和市场分析;③ 豆包的深入研究,可以做行业分析。
(6) Agent Protocols(智能体协议)
Agent Protocols 是一套标准化的规则、格式和流程,用于规范人工智能代理(Agent)之间以及代理与外部系统(如数据、工具、服务等)之间的通信和协作。
现在智能体多了,各有各的协议,Agent Protocols 是用于统一Multi-Agent Communication(多代理通信) 的协议标准,核心是“让不同Agent能听懂彼此的话”,简化跨平台协作。
**知识卡片:**常见Agent Protocols协议:
- A2A Protocol(Agent-to-Agent):允许Agent之间直接交换信息,比如“Agent 1负责查天气,Agent 2负责订酒店,它们可以互相传递数据,帮你规划旅行”;
- MCP(Message Communication Protocol):用于Agent与服务器之间的通信,比如“Agent 通过MCP向服务器发送请求,获取用户的历史订单信息”。
典型代表是:① Google AI Device Kit(ADK):多Agent跨设备调用;② OpenAI MCP(Model Context Protocol):跨模型的上下文共享;③ 字节跳动Coze协议层:支持不同Bot的消息与任务协作;④ 阿里云AgentFlow:跨Agent编排与协议转换。
6、Agent的限制的三因素:算力、隐私、数据
Agent是自主软件程序,由记忆、权限、工具、决策机制和学习机制等关键技术组件构成,它们在执行任务时面临算力限制、数据壁垒、隐私保护等限制因素,解决这些限制是 Agent顺利落地的关键。
(1)算力需求随着模型复杂度增加而激增,特别是在大语言模型和多模态模型的应用中。算力需求的增长导致训练和推理需求难以满足,同对在高使用期算力分配不均可能造成延迟或无法访问。
(2)Agent的数据需求是其感知、学习和决策的基础,但面临优质语料短缺、数据打通难度、有毒数据增多和数据多样性不足等技术瓶颈。
(3)隐私保护是Agent应用的前提,确保用户信任和法律合规。个人或组织对其数据拥有控制权和保密权的状态。Agent依赖数据驱动,而数据往往涉及敏感信息。

二、市场空间&现状
根据第一新声智库,2025年中国企业级AIAgent市场规模将达到232亿元。2023-2027年中国企业级AI Agent市场规模复合增长率将达到120%,至2027年,企业级 Agent市场规模将达到655亿元。
AI Agent将对Saas市场的重构,相关企业在SaaS产品中集成AI Agent功能所产生的市场价值巨大。

目前 Agent 行业渗透:智能客服约70%,成为最成熟场景; 数据分析约60%,是业务决策的核心支撑;内容创作约45%;研发设计、营销、知识助手、智能辅导等渗透率较低,场景孕育着下一轮爆发点。

三、产业链全图谱
AI Agent产业链上游:可以分为基础设施与技术供应商,注重算力和数据基础;中游:为 AI Agent研发与集成商,主要可以分为系统集成厂商、软件开发厂商以及解决方案供应商,其中目前大部分企业正在处于优化产品和探索应用场景阶段;下游:主要为应用与终端客户,强调应用落地和用户体验。
AI Agent的产业发展依赖于大模型技术的迭代、算力的提升以及应用场景的拓展,各环节相互协作,共同推动AI Agent的商业化进程。

1. 上游:基础设施与技术提供商
国内主要可以分为AI芯片、服务器集成厂商、算法框架、大模型厂商、数据服务商以及云计算平台等
(1)算法框架:业内通常使用谷歌Tensorflow和脸书Pytorch作为AI算法框架,昇思MindSpore于2023年打造业界首个AI融合框架,提供全面的分布式并行能力。
(2)大模型:AI Agent的核心驱动力是大语言模型。因此,大型的开发者在产业链中占据重要地位,提供基础模型和算法支持,使得AI Agent能够具备感知、理解、决策和执行的能力。
下表:2025 中国大模型 Top 10 排行榜
| 排名 | 公司 | 代表模型 / 产品 | 排名 | 公司 | 代表模型 / 产品 |
| 1 | DeepSeek | DeepSeek-V3 | 6 | 智谱 AI | GLM-4 |
| 2 | 阿里.千问 | Qwen3 | 7 | 月之暗面 | Kimi / K2 |
| 3 | 字节·豆包 | Doubao 1.5 Pro | 8 | MiniMax | 海螺 AI |
| 4 | 腾讯· 混元 | 元宝 | 9 | 科大讯飞 | 星火 X |
| 5 | 百度·文心一言 | Ernie 4.5 / 5 | 10 | 百川智能 | Baichuan-M2 |
(3)AI 芯片 :提供算力支持,是灵魂,当前主流的AI agent 芯片主要分为三类,GPU、FPGA、ASIC:
①、GPU:英伟达NVIDIA一家独大,占据81%的市场份额,其次是AMD和Intel,分别占据18%和1%的市场份额;国内厂商:寒武纪、景嘉微、海光信息、天数智芯,功能和应用领域等方面都有了提升;
②、ASIC :博通AVGO、美满电子MRVL 两家全球巨头;国内寒武纪、芯原股份、嘉楠科技 CAN 也在奋力直追;
③、FPGA:安路科技是国内FPGA业务领军企业;复旦微电是FPGA芯片重要供应商。
(4)服务器: 国内龙头公司:inspur浪潮、 Sugon 中科曙光和华为;
(5)数据服务:国外:澳大利亚的Appen;国内:浪潮 、 标贝科技是龙头。
2.中游AI Agent研发与集成商:
负责将大模型与其他技术组件(如规划、记忆、工具使用和行动模块)相结合,开发出具有特定功能和应用场景的 AI Agent产品。通常拥有强大的研发团队和技术实力,能够不断优化和迭代产品以满足市场需求。
(1)系统集成:国内头部是–联想 、科大讯飞、用友 、钉钉 、 况客科技、 Moka公司;
(2)软件平台开发:面壁智能 、实在智能、汇智智能 、澜码科技 、联汇等都是国内不错的公司;
(3)解决方案提供商: 华为云 、百度智能云、 阿里云、 腾讯云 京东云 天翼云等国内公司。
3.下游应用厂商:
AI Agent的应用场景广泛,聚焦B端与C端场景落地。包括智能客服、个人助理、自动驾驶、软件开发、财务管理等多个领域。应用厂商根据不同行业和场景的需求,利用AI Agent 技术开发出各种应用产品和服务,直接面向终端用户,负责产品的推广和销售。
(1)通用智能体:
备跨领域适应性,定位为“全能助手”。


(2)垂直智能体:
专注特定场景或领域,强调专业知识,定位为“行业专家”


四、相关标的
以下是不完全列举:
① AI+数据: 海天瑞声、深桑达A;
② AI+农业: 托普云农;
③ AI+医疗: 嘉和美康、卫宁健康、开勒股份、润达医疗、国新健康、久远银海、塞力医疗、创业惠康、思创医惠、东华软件、医脉通;
④ AI+教育: 科大讯飞、豆神教育、佳发教育、竞业达、拓维信息;
⑤ AI+能源: 国能日新、国网信通、朗新集团、南网科技;
⑥ AI+交通: 千方科技、易华录、万集科技、金溢科技、信息发展;
⑦ AI+资管: 恒生电子、顶点软件;
⑧ AI+银行: 宇信科技、天阳科技、博彦科技、京北方、长亮科技;
⑨ AI+保险: 中科软、新致软件;
⑩ AI+政务: 太极股份、南威软件、新点软件、数字政通、拓尔思;
⑪ AI+司法: 金桥信息、华宇软件、通达海;
⑫ AI+财税: 税友股份、中科江南、博思软件;
⑬ AI+烟草: 中科信息;
⑭ AI+港口: 盛视科技;
⑮ AI+企业服务: 金山办公、用友网络、金蝶国际、浪潮数字企业、光云科技、致远互联、泛微网络;
⑯ AI+建筑: 广联达、品茗科技;
⑰ AI+零售: 石基信息、焦点科技、值得买;
⑱ AI+具身: 东土科技、能科科技;
⑲ AI+工业软件: 中望软件、华大九天、中控技术、索辰科技、宝信软件。
最后
如今技术圈降薪裁员频频爆发,传统岗位大批缩水,相反AI相关技术岗疯狂扩招,薪资逆势上涨150%,大厂老板们甚至开出70-100W年薪,挖掘AI大模型人才!
技术的稀缺性,才是你「值钱」的关键!
具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

是不是也想抓住这次风口,但卡在 “入门无门”?
- 小白:想学大模型,却分不清 LLM、微调、部署,不知道从哪下手?
- 传统程序员:想转型,担心基础不够,找不到适配的学习路径?
- 求职党:备考大厂 AI 岗,资料零散杂乱,面试真题刷不完?
别再浪费时间踩坑!2025 年最新 AI 大模型全套学习资料已整理完毕,不管你是想入门的小白,还是想转型的传统程序员,这份资料都能帮你少走 90% 的弯路
👇👇扫码免费领取全部内容👇👇

部分资料展示
一、 AI大模型学习路线图,厘清要学哪些
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:大模型核心原理与Prompt

L1阶段: 将全面介绍大语言模型的基本概念、发展历程、核心原理及行业应用。从A11.0到A12.0的变迁,深入解析大模型与通用人工智能的关系。同时,详解OpenAl模型、国产大模型等,并探讨大模型的未来趋势与挑战。此外,还涵盖Pvthon基础、提示工程等内容。
目标与收益:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为AI应用开发打下坚实基础。
L2级别:RAG应用开发工程

L2阶段: 将深入讲解AI大模型RAG应用开发工程,涵盖Naive RAGPipeline构建、AdvancedRAG前治技术解读、商业化分析与优化方案,以及项目评估与热门项目精讲。通过实战项目,提升RAG应用开发能力。
目标与收益: 掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。
L3级别:Agent应用架构进阶实践

L3阶段: 将 深入探索大模型Agent技术的进阶实践,从Langchain框架的核心组件到Agents的关键技术分析,再到funcation calling与Agent认知框架的深入探讨。同时,通过多个实战项目,如企业知识库、命理Agent机器人、多智能体协同代码生成应用等,以及可视化开发框架与IDE的介绍,全面展示大模型Agent技术的应用与构建。
目标与收益:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。
L4级别:模型微调与私有化大模型

L4级别: 将聚焦大模型微调技术与私有化部署,涵盖开源模型评估、微调方法、PEFT主流技术、LORA及其扩展、模型量化技术、大模型应用引警以及多模态模型。通过chatGlM与Lama3的实战案例,深化理论与实践结合。
目标与收益:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。
二、 全套AI大模型应用开发视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。

三、 大模型学习书籍&文档
收录《从零做大模型》《动手做AI Agent》等经典著作,搭配阿里云、腾讯云官方技术白皮书,帮你夯实理论基础。

四、 AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

五、大模型大厂面试真题
整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

六、大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

适用人群

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】


被折叠的 条评论
为什么被折叠?



