【珍藏必读】大模型智能体跃迁:三大核心挑战与未来应用前景

在日前举行的上海外滩大会上,清华大学计算机系长聘副教授、面壁智能联合创始人兼首席科学家刘知远发表主题演讲,分享大模型智能体发展的关键技术与挑战。

从去年开始,智能体在社会上获得了广泛关注。我从人工智能发展的角度,谈一谈智能体有哪些核心问题,关键技术是什么,在接下来的发展过程中需要解决的挑战,以及一旦挑战被解决了,可能产生怎样的巨大应用。

在这里插入图片描述

人工智能有一个可以定义出来的能力图谱,大致包括四个方面的能力:首先要有基座大模型,像大脑一样高效思考世界,还需要敏锐的感官,也就是多模态智能来感知世界。这两部分从 2018 年随着大模型发展,已经形成包括文本基座模型和多模态模型的前瞻式应用。

除了这两部分,还有两个非常重要的组成部分——探索能力,能像一个专业智能体(Agent)一样,具备专业能力,探索、改造这个世界;合作能力,专业智能体如何互相高效协作,形成群体智能。这是人工智能的四个重要板块

在这里插入图片描述

从这张图谱中,可以清晰看到人工智能发展的显著脉络。从 2018 年到 2025 年,我们见证了模型随着预训练技术,从一个非常小的、只有几千万参数模型,增长到上万亿的规模,是一个类似于脑容量越来越大的过程,它具有更强的认知世界的能力。

我们认为,再进一步还需要让模型进入到真实环节、真实世界去进行交互,这个过程就是一个智能体的过程,也就是通过工具使用、自主学习,让智能体变成在相关专业领域里自主探索的专业智能体,进一步形成群体智能。人工智能应该会在最近这几年里,实现从大模型向智能体跃迁。

从2022年开始,国内外陆续开展与智能体相关的探索,相当于在这一跃迁过程的浪潮里,国内非常多学者和科技工作者所从事的工作,已经站在了世界前沿。我们还要进一步深入到人工智能未来发展的趋势,去看待智能体的核心挑战是什么。人类社会本身是人类智能高度发达的阶段,我们可以想象,对于人工智能未来发展的态势来说,人类社会的发展会有非常重要的启示。

人类社会发展有什么重要特点?在社会学领域有两个重要观点,体现了人类社会从生产力、效能方面的特点。第一个是社会学奠基人涂尔干提出,「个体的专业化是群体效能提升的基础」。也就是说,在过去几百年里,人类社会经历了每一个人都在提高专业化的程度和规模,然后变得发展壮大的过程,这会成为人工智能发展的重要方向,也就是要去构建各行各业、各个领域的专业智能体。

另一个是马克思在社会学方面提出的观点,「协作社会化是生产力发展的必然结果,科技革命为这种扩张提供技术可能」。过去几百年,随着技术发展,互联网和信息社会出现,整个人类社会协作的社会化广度和效率都大为提升。从这个角度讲,我们可以预期未来人工智能的发展也一定会构建一套更加高效、广泛的多智能体系统,这将构成接下来两个非常重要的组成部分。

我们认为,「专业智能体」将是下一代人工智能非常重要的发展方向,要让这个模型进入到一个多样、多变、复杂的真实世界中进行交互,来完成相关的复杂任务。我们可以设想,当大模型放到一个真实环节,它所面临的挑战是什么,挑战就是环境的多样性、环境的多变性,以及任务的复杂性。

针对这些挑战,我们认为需要解决的,就是智能体的「三个性」的问题。

第一个挑战是智能体的泛化性,在真实世界里,智能体需要面对多样化的环境,需要在训练过程中接触的环境之下,模型能做出合理决策,完成复杂任务。我们可以设想,把大模型放到不同领域,有可能是编程领域、数据库领域、系统环境领域,也有可能是物理环境领域或其他各种专业,我们预期这个大模型、智能体能成为软件开发、数据分析、系统触控、机械控制等各个方面专业智能体,这件事情体现的就是智能体背后的大模型泛化能力。

最近两年,能看到泛化性方面日新月异的发展。不同领域都有相应的专业工具,智能体要能使用各种各样的专业工具,这是一个重要方面;同时,相关的专业领域也有各自的知识,有自己的SOP(标准化作业流程),也要能让智能体掌握使用。这些要求会成为智能体泛化的重要体现。

在这方面,一个重要特点是要让智能体从一个动态环境中学习的能力。我们看到有非常多科技工作者在提世界模型,其实就是要构建多样化的环境,来为智能体提供学习泛化能力的过程,这是智能体泛化性的重要体现。

第二个挑战是智能体的自主性。智能体要进入到一个动态环境里面,就要像人一样在使用中适应环境,主动探索,不断学习。它需要能实现感知自主、决策自主和学习自主,我们认为这是非常重要的发展范式。

在过去一年里,包括DeepSeek R1和OpenAI O1,表面上看是深度思考能力,更重要的技术其实是背后的「大规模强化学习」,这体现了大模型或者人工智能学习从过去大模型的模仿学习范式跃迁到探索式学习,甚至再进一步,进入到完全开放的环境,进行自主探索和学习。我们认为未来 2~3 年内将实现这样的自主性构建。

如何让大模型或智能体具备自主探索和自主演化的能力,是一个非常值得探索的话题。国内外有非常多学者在探索这方面工作,最近半年有非常突飞猛进的发展,如果大家去搜reverse learning会有非常清晰的感受。

第三个挑战是智能体的长程性。也就是说,它能不能去解一个越来越复杂的任务。任务的复杂性体现在完成步骤足够长,甚至可能是持续更长,甚至终生的相关任务,是一个越来越长的解决问题的链条。

在这个方面,过去两年有非常多的探索,要让模型具备更长的上下文感知和经验复用的能力。核心技术和动态有两个,第一是在模型内部设计高效架构,让模型具备处理更长上下文的能力;第二是在智能体层面设计更好地管理历史信息的记忆架构,突破当前上下文的窗口局限,这个突破将会让模型能在更多复杂场景里具备更强的记忆能力和经验复用能力。

如何把上下文冗余消除掉?如何让计算成本急剧下降?如何能让推理效率急剧提升?如何实现对历史重要信息的主动记忆,是构成解决长程性的关键技术。

总体来看,专业智能体还有一个共同的技术基石「自主强化学习」。过去一年,大模型学习范式从模仿学习向探索学习跃迁,智能体的三大核心能力,包括泛化性、自主性和长程性,都高度依赖于自主强化学习的提升。以上是专业智能体方面,我们认为的核心技术与挑战。

接下来就是「多智能体系统」。当我们在各行各业构建足够专业的智能体之后,就要让智能体之间进行通信与协作。如何实现智能体的自主协作和动态演化,从而形成全球范围内的智能体互联网,是实现人机协同群体智能第二次涌现的重要基础。

让多个智能体具有不同的专业背景,并且让它们合作起来,显然是可以去完成单个智能体没办法完成的、更加复杂的任务,但这个合作过程本身会引入非常大的额外计算。智能体系统面临的关键挑战在于——多智能体系统能力提升与资源消耗之间产生非常大的矛盾。我们需要解决的,是如何在有效发挥群体智能的同时,降低群体协作的资源开销,提升协作效率,也就是刚才提到的协作的社会化效率问题。

在这个方面,核心需要解决三大问题:如何让这些智能体高效交互,它们互相之间对话需要有非常高效的语言;遇到一个任务时,如何有效实现多智能体分工,让这些智能体避免内耗,这是高效的任务路由。我们还需要这个多智能体能从历史工作中学习经验,实现持续演化。这是我们认为构建高效多智能体系统非常重要的核心策略。

高效交互方面,包括Anthropic、Google在内的很多团队,都在尝试提出面向多智能体的标准化通信协议,不管是A2A,还是我们团队提出来的 Internet of Agents,都在尝试构建一个更加高效的交互协议,这像历史上的互联网协议标准化过程一样,也是争夺话语权非常重要的方面。

在交互协议方面,非常值得做的工作是,如何研发一个标准化、最小化交流协议和互操作验证平台,能降低通信开销,提升智能体高效协同。

协作方面,各大公司都在构建多模态研究团队,并且推出自己的多智能体协作系统框架,用于探索智能体组织化、自动化编排和动态协作。这也是国内在这方面做得很有前景的课题。

这方面的核心问题是如何能让多智能体进行分布式自主编排,让路由过程更加高效,这里不再过多介绍,国内外已经有非常多的案例。

群体演化方面非常前沿的问题,对应前面提到的自主强化学习。面向专业智能体,当然需要它能具备自主的学习能力。任何一个优秀团队都是善于向历史去学习的,我们可以想像,一个多智能体的群体团队,它也应该能从历史工作经验中总结经验、总结教训,这就涉及到多智能体的群体演化与学习的能力。如何实现智能体集群经验共享与知识迁移,是这方面非常关键的问题。

总结一下,我们认为下一代群体智能非常重要的目标,是实现专业智能体的规模化和专业化,实现群体智能的协作社会化的广度和效率,从而实现面向人工智能的第二次涌现。我们看到过去五年,大模型越来越大、能力越来越强,它更像是个体智能的涌现,接下来要迎来的是由众多专业智能体合作的群体智能涌现。

有一个非常值得探索的底层问题是,群体智能的涌现激励到底是什么,我们如何做到任何一个群体智能团队新加一个智能体,都能让它合作效能比之前更高;给定一个智能体团队,如何找到最优的通信合作机制。这些都值得进一步探索。

整个人类社会都是由一个又一个人类专家所构成的,未来一定会实现通过构建岗位孪生的专业智能体和组织孪生的智能体群,形成群体智能的涌现。这就是我们对迈向下一代通用人工智能(AGI)智能体阶段的关键问题和愿景。

来源:面壁智能

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值