从通用大模型到可执行智能体,AI正沿着过程自动化历经技术的拐点。
正值Agent迅速迭代时期,昆仑万维董事长兼CEO方汉从产业出发,提出了一个全新的视角:
Agent并不是通用人工智能的雏形,而是一种可验证过程的自动化系统。它不擅长创造新范式,却极其擅长把已经被人类验证过的流程规模化复制。
换言之,支撑当前这轮Agent热潮的底层动力,并非基座模型的性能突破,而是在推理能力提升、长思维链成熟之后,“过程”开始被批量学习与调用。

在他的判断中,从ChatGPT到DeepSeek,标志着大模型完成了从“背答案”到“背过程”的关键跃迁:前者打开了通用对话与生成能力的入口,后者则通过更高效、更长推理的方式,把大模型推向以过程泛化为核心的新阶段。
也正因此,Agent最先落地的并非千行百业,而是流程稳定、结果可验证的AI Office。所以长期来看,将是基础模型逐步收敛,而围绕具体流程构建的专业Agent成为组织运行的基本单元。
在他看来,最终Agent重塑的不是某个岗位,而是整个组织——人类将从重复执行者,转变为过程的架构者,这也将成为Agent时代人类表达自我的新范式。
为了完整呈现方汉的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能提供新的视角与洞察。
MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。
一、核心观点梳理
- Skywork Super Agents是昆仑万维今年5月发布的产品,它包括五个专家Agents和一个通用Agent,PPT模式可以在五分钟之内生成30页PPT。40%的DAU用户使用PPT模式。
- Agent的本质不是AGI,Agent的本质是可验证过程的自动化,擅长数学代码和结构化决策,不擅长创新范式突破和新框架。现在到了Agent发展的拐点。
- AI进程最直接的落地场景是AI Office;第二是各种各样的垂类场景,但这些场景存在一个巨大问题,就是不存在好的数据集。
- 通用Agent的渠道之争,对传统渠道来说是生死之战。只有硬件手机厂商才能决定自己的手机上可以装什么Agent,其它任何Agent厂商都是没有这个能力的。
- Agent将重写公司组织,因为流程属于过程数据,只要可验证就可以被自动化。而我们的每一个岗位实际上变成了Agent的执行上下文,重复操作的岗位将消失,取而代之的是过程架构师。
- ……
以下为方汉演讲全文:
二、昆仑万维建立从通用到专家的Agent产品形态
今天我给大家分享的是智能体思考与展望:《昆仑万维Skywork Super Agent演进之路》。
首先简单给大家介绍一下我们,我们成立于2008年,2015年上市,业务覆盖全球100多个国家和地区,全球月活用户近4亿,今年前三季度营收58亿,其中海外收入占比93%。
我们从2020年开始做AI方面的工作,2022年12月发布了中国首个开源的13B中文预训练大模型,之后也在不断迭代过程中。今年5月推出了Skywork Super Agents,并且在海外发布了Skywork.ai。

自成立以来,昆仑万维深耕全球市场,拥有全球化运营能力,我们收入92%来自于海外,这种深厚的国际化基因使得我们在AI时代可以理解不同市场的需求,并且把AI的产品和服务更高效地推广到全球。
目前AI音乐Mureka、Skywork Super Agents、AI社交Linky在海外都已经产生实际的收入,并且在高速的成长中。
今天重点介绍的是Skywork Super Agents这个产品,是从通用到专业的Agent,包括五个专家Agent和一个通用Agent,可以在5分钟之内生成30页的PPT,我们当前的DAU占比中有40%用户在使用PPT模式,成为Skywork生态中用户使用量和好评量双排名第一的功能。
我们所有内容都附带清晰可追溯的参考文献,彻底解决AI幻觉问题。我们也拥有强大的多模态输出能力,可以一键生成Word文档、PPT、Excel、播客、视频、小程序等多样化的内容,我们也支持上传多种格式的文件、录音、网址,基于知识库内容生成文档PPT、表格、网页、播客。

今年5月22日我们发布了Skywork Super Agents,大家可以看到下半年进行了紧密的迭代过程,不断增加多种多样的智能体,功能也在不断升级,赋能办公效率革命。
三、Agent的本质是可验证过程的自动化
我想分享一下我们对于Agent的认知,我们认为Agent的本质并不是通用的人工智能,而是可验证过程的自动化,非常擅长数学、代码、结构化决策,但并不擅长创新、范式突破、新框架。

为什么会这么说?这可能跟很多人的认知,或者业界常用认知有差别。
我们认为现在是拐点,因为众所周知大模型是从ChatGPT开始,在早期的GPT类模型里是典型的背答案,自从GPT出现之后,我们发现大模型已经可以背过程,因为CoT本质上是把过程通过大模型输出出来,最后增加结果的正确性,尤其最近发布的DeepSeek V3.2,大家可以看到其用超长的推理Token取得了更高的准确率和更好的结果。
同时大模型在背过程的过程中学会了泛化过程,可以把很多过程泛化到尽可能多的任务上去,不过问题在于仍然没有办法发明新过程。
我觉得Agent大行其道的根本逻辑,来自于过程可学习的大规模的工业化和产业化,所以说现在到了一个拐点。
四、Agent最现实的场景落地
那么Agent能落地到哪里?首先最肯定的是AI Office,首先流程稳定、跨行业使用、结果可验证。
二是各种各样垂类场景,包括医疗、金融、建筑、法律、制造,但是这些场景有一个巨大的问题,不存在一个好的过程数据集,这点跟数学和编程不一样。
编程有GitHub、开源软件,所有开源软件由于版本控制存在,过程数据被记录得最完善,而数学公式的证明是要过程的,这样导致数学和编程成为全世界过程数据最全的两个领域,这也是现在所有文本大模型的Benchmark以编程和数学为主的重要原因。
最近发布的DeepSeek也是以IMO数学竞赛作为一个验证标准。

但是对于医疗、金融、建筑、法律、制造等各行各业,千行百业,过程数据集是否存在呢?根本就不存在。
所有这些数据集都必须进行重建之后,我们的Agent才能够在垂类场景里应用,这点非常像PC操作系统的发展历史。
大家都知道微软发明了DOS、Windows操作系统,但是对于微软自己来说并没有试图把Windows作为能解决所有问题的通用的操作系统或者通用的一个APP。它只做了Office、Database、Developer Tools这些常用的工具,对于各行各业的工具,像图像处理、数字处理、工业设计,仍然有各行各业的巨头去做自己的行业软件,最后取得非常大的成功。
我相信对于Agent来说,通用Agent很有可能是一个相对比较伪命题的命题。但是像AI Office这种比较通用的产品,我认为仍然有存在空间。对于各类垂类场景的通用Agent,我们认为应该是不存在的。
这里面存在一个问题,通用Agent的渠道之争,大家都知道豆包手机出来之后很受业务追捧,各个厂家纷纷封禁了豆包可以操作他们APP的能力,这是为什么?
因为本质上这种APP的渠道之争对于老渠道来说是生死之战,怕新的Agent的厂商悄悄取代它,所以他们一定会把持住自己老的渠道。
这些渠道有哪些?首先是操作系统厂商,对于手机上的通用Agent来说,只有硬件手机厂商才能决定手机上可以装什么,其他任何Agent厂商都是没有这个能力的。
像其他的通用渠道,浏览器是相对公平的渠道,因为全世界浏览器目前只剩下Chrome、Firefox、微软Edge,还有我们的Opera,只剩下几家浏览器厂商,浏览器是相对公平的赛场,大家可以在浏览器上做很多事,而且浏览器都开放了插件,限制相对少。
而办公软件市场更加残酷,大家都知道飞书、钉钉、WPS、Office这些软件,他们也是一个重要的入口。但是从PC软件发展来看,即使Office软件和企业通讯软件非常发达,但仍然有大量的企业第三方软件在生态当中存活。
所以我认为这个赛道仍然是相对比较好的赛道。因为办公软件的需求是长尾市场,即时通讯由于社交网络的原因,垄断性更强,它作为通用Agent的入口,像支付宝和微信支付之争一样,其他厂家很难插进去手的。
最后一个比较奇特的就是搜索引擎,实际上我认为现在所有的大模型的Chatbot,ChatGPT、豆包、千问,本质上是分食传统搜索引擎的市场,因为Chatbot的交互方式是跟传统搜索引擎是类似的,都是输入对话,然后大模型或者搜索引擎给予反馈,这些也会逐渐融合。
但是搜索引擎在每个国家最后都只会有1到2个胜利者,在全球可能是谷歌,在中国是百度。所以我认为搜索引擎的入口和Chatbot入口也是非常重要的通用Agent渠道。
五、Agent时代,公司和人类角色的变化
在这个过程中,公司的组织将被重写,公司内部的流程将变得非常关键,因为我们的流程属于过程数据,过程数据只要可验证,就可以被Agent自动化,每一个岗位变成了Agent的执行上下文,每一个岗位有上级,有下级,有工作职能,这个和Agent上下文非常像。
而我们所有人才将变成新过程的发明者,只有发明新过程,才有存在的必要。举个例子,现在传统制造业有很多制造业工厂向黑灯工厂演进。大家都知道黑灯工厂仍然有员工,这些员工负责什么,负责黑灯工厂的制造流程的维护,以及新制造流程的迭代。
我认为Agent跟现在中国黑灯工厂一样,所有的人都会变成Agent流程的维护者和创造者。

最后分享下岗位迁移的趋势,重复操作的岗位一定会消失,但是过程设计的岗位也会兴起,所有的人类员工都将成为过程的架构师,在不断地维护老过程、创造新过程,只有这样才能够让Agent在组织内得到大规模的应用,整个组织的效率才会得到提升。
以上就是我对昆仑天工Skywork Super Agents和它的演进历史的分享,以及我们公司对于Agent这个赛道的思考,最后希望我们能够早日实现通用人工智能,让每个人能更好地塑造和表达自我。谢谢。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

1550

被折叠的 条评论
为什么被折叠?



