引言
随着大模型和生成式AI的发展,AI Agent成为2024年底AI领域最火热的话题之一。LangChain发布了“State of AI Agents in 2024“ (https://www.langchain.com/stateofaiagents)的调查报告。
报告显示,Agent技术在实际业务场景中的应用正在逐渐开始加速。
本期,我们邀请质变科技数据科学家、AI-ready数据云团队布道师则明为大家分享系列话题《Agentic AI》,分别从Agentic AI的发展脉络、技术架构和当前开源社区所提供的支持,以及具体的商业应用等方面进行分享,本篇是Agentic AI系列的第一篇。
AI Agent的基本特征
AI Agent概念本身并不新鲜,本质上是一个探索如何通过计算及模拟人类智力活动的思考框架。Agent本质上有以下几个基本特征:
1.自主行动:Agent一旦训练和部署完成,能够自主进行决策和行动,而无需人工进一步干预。
2.环境感知:Agent能够(主动或被动)获取其执行环境的各种上下文信息。甚至能以多种模态接受和处理环境信息。
3.工具使用:Agent在完成任务的过程中,能够通过工具使用的能力与各种系统进行交互(包括其他Agents)。
随着AI技术的发展,Agent能力也获得进一步提升:
4.多方协调:Agent能够自主的与其他智能系统或Agent配合生成全局计划以完成各种任务。
5.自主学习:Agent能够从过往的任务经验和反馈中获取所需要的数据,对自身进行改进,从而进一步提升任务性能。
在人工智能的发展史上,曾经出现多种技术为AI Agent提供支撑,比如70~80年代的专家系统,通过基于规则的推理来模拟人类专家在特定领域的决策行为。在基于统计的机器学习兴起之后,AI Agent能从大量数据中自动学习和发现特定的模式和规律,减少了对(人工)规则的依赖。而神经网络和深度学习的兴起则进一步提升了AI Agent在自然语言、语音图像等多模态数据上的性能。
大模型时代AI Agent的智能增强
随着预训练大模型的兴起,AI Agent进一步得到了增强,主要体现在以下几个方面:
1.CoT & Planning:思维链及其相关的衍生技术进一步提升了Agent计划制定的泛化能力。通过对复杂问题的拆分,ReAct打开了大模型在行为规划方面的思路;随后出现了Tree-of-Thought, Graph-of-Thought, Forest-of-Thought等各种个样的发展;这进而又推动了执行路径的优化,比如引入MCMC (Monte-Carlo Markov Chain) 等技术等等。
2.Memory:传统Agent记忆往往依赖于事先定义的schema,这限制了Agent记忆可用的状态空间和表达能力。GenAI提供了统一的语义表征,Agent记忆从而获得了近乎“free form”的能力,大大扩展了Agent记忆的应用范围。
3.多模态能力:基于预大模型的技术实质上创建了一个统一的语义空间,从而使得各种模态的数据能在这个统一的空间里进行训练,应用程序因而也能够对多种模态的数据进行统一的处理。
4.Self-reflection:Agent在LLM的加持下,能够对自身的计划和执行结果进行进一步的分析,获得改进以进一步提高准确率等性能。
以上种种能力结合到一起,完善了一个通用MAS的场景。在 GenAI的加持下,Agent现在有了统一的语义表达方式来进行通信,同时也拥有了动态计划的生成能力,还能够通过反思对计划和结果进行反思。这实际上形成了某种递归的问题解决模式,而这正是智能的核心特征之一。(《GEB》)
随着简单的LLM封装在各种商业场景中逐步暴露出能力的局限,Agentic AI继而在生成式AI这波浪潮后深入发展。在德勤发布的“How AI agents are reshaping the future of work”( https://www2.deloitte.com/content/dam/Deloitte/us/Documents/consulting/us-ai-institute-generative-ai-agents-multiagent-systems.pdf) 报告探讨了Agentic AI在复杂(和不可预测)场景中的明显优势。
作为deeplearning.ai的创始人,Andrew Ng也在各种场合探讨Agentic AI Workflow的重要性(Andrew Ng Explores The Rise Of AI Agents And Agentic Reasoning | BUILD 2024 Keynote https://www.youtube.com/watch?v=KrRD7r7y7NY)。在他看来,Agentic AI代表了新一代智能体技术的发展,其核心是通过分步骤规划、迭代式工作流和角色分工,使智能体能够以更高效和精准的方式解决问题。同时他也提出了当前Agentic AI中最核心的几种设计模式:
1.反思(Reflection)
2.工具使用(Tool Use/API Call)
3.计划(Planning)
4.多智能体(Multi-Agent Collaboration)
随着技术理解的进一步加深和实践中的优化和调整,Agentic AI已经在各种场景中得到应用和发展,2025年成为AI Agent元年 (Why 2025 Will Be The Year of AI Agents https://www.youtube.com/watch?v=kHPXbo2OkzA)。未来,Agentic AI将从单一Agent发展到“群体协作”的模式,彼此协作甚至对抗,完成更复杂的任务。
不止chatGPT,个性化+自主化数据分析,超越BI指标平台
作为AI时代Data Infra无人区的探索者,质变科技于近日发布了一项以数据为中心的AI分析服务Relyt AI。依托于以大模型为基础的可解释分析引擎、端到端(E2E)的数据理解与管理技术,以及支持PB级大规模计算的核心技术,Relyt AI能够提供包括基于数据集的AI问答、自然语言交互的数据分析、探索与洞察等一系列能力。这些功能广泛应用于对准确性要求极高的工作场景。
目前,Relyt AI分析服务已经在全球市场获得了超过110万用户的高频使用和验证,累计处理超200万文件、1200万数据任务。AI-ready Data Infra正在持续迭代,质变科技期待与全球客户一起,激活每个人的数据潜能。