Chapter 2: 智能体发展史 (Part 6: 技术全景与历史脉络)

我们在前几篇中深入了微观的技术细节,现在我们需要回答一个宏观问题:我们是如何从 1950 年代的逻辑符号,一步步走到今天这个“大模型+智能体”的时代的?

2.4.5 智能体发展关键节点概览

人工智能体的发展史并非一条笔直的单行道,而是几大核心思想流派长达半个多世纪交织、竞争与融合的历程。主要有三大思潮主导着不同时期的研究范式 :

  1. 符号主义 (Symbolism)
  • 代表人物:司马贺 (Herbert A. Simon)、明斯基 (Marvin Minsky)。
  • 核心思想:智能的核心在于对符号的操作与逻辑推理。
  • 产物:SHRDLU、专家系统、深蓝 (Deep Blue)。
  1. 联结主义 (Connectionism)
  • 代表人物:杰弗里·辛顿 (Geoffrey Hinton) 等。
  • 核心思想:源于对大脑神经网络的模拟。
  • 产物:反向传播算法、卷积神经网络 (CNN)、Transformer。
  1. 行为主义 (Behaviorism)
  • 核心思想:强调智能体通过与环境的互动和试错来学习最优策略(现代化身为强化学习)。
  • 产物:TD-Gammon、AlphaGo。

💡 深度解析:大融合 (The Great Convergence)
进入 21 世纪 20 年代,这些流派以前所未有的方式深度融合:
GPT-4 (联结主义) 作为大脑,执行 CoT (符号推理),并调用 Tools (行为/动作)。这就是现代智能体架构的本质——神经-符号结合 (Neuro-Symbolic Integration)

智能体发展演进时间线

下图梳理了从 20 世纪 50 年代至今的关键理论、项目与事件,展示了技术如何一步步演进 :

时期 (Era)核心思想/流派关键智能体/项目/技术核心贡献 (Core Contribution)
符号主义时期
(1950-1970)
符号主义
(Symbolism)
• 逻辑理论家 (Logic Theorist, 1956)
通用问题求解器 (GPS, 1959)
• 机器人 Shakey (1966-1972)
符号推理可行性:验证了机器执行形式化符号推理的可行性 。
手段-目的分析:GPS 引入了 Means-Ends Analysis,为目标驱动规划奠定基础 。
具身智能先驱:Shakey 是首个集成感知、推理与物理交互的移动机器人 。
专家系统与联结主义复苏
(1980s)
符号主义
联结主义
专家系统 (MYCIN, XCON)
反向传播算法 (Backprop)
知识工程:将领域专家知识编码为规则库,使系统在特定领域辅助决策 。
神经网络复苏:反向传播为训练多层神经网络提供了有效方法,奠定了学习能力的基础 。
第二次 AI 低谷与新起点
(1990-2000)
符号主义
联结主义
行为主义
• 深蓝 (Deep Blue, 1997)
• LeNet-5 (1998)
• TD-Gammon (1992)
• Q-Learning (1989)
搜索与规划:深蓝通过大规模搜索在国际象棋领域达到顶尖水平 。
特征学习:CNN (LeNet-5) 实现从原始像素自动学习特征。
自博弈与 RL:TD-Gammon 证明智能体可通过自博弈达到高水平;Q-Learning 提升了无模型 RL 的灵活性。
深度学习时代
(2010s)
联结主义
行为主义
• AlexNet (2012)
• DQN (2013)
• AlphaGo (2016)
• Transformer (2017)
视觉爆发:AlexNet 推动深度学习在图像识别领域的广泛应用 。
端到端控制:DQN 将深度学习与 RL 结合,直接从像素学习策略。
神经符号典范:AlphaGo 结合 DL、RL 与蒙特卡洛树搜索 (MCTS)。
注意力机制:Transformer 成为现代 LLM 的标准架构 。
大模型时代
(2020-2022)
LLM 驱动GPT-3 (2020)
思维链 (CoT, 2022)
少样本学习:展示了作为通用智能基础模型的潜力 (Few-shot) 。
推理增强:CoT 通过生成中间推理步骤,显著提升复杂逻辑任务的表现。
智能体时代
(2023 至今)
智能体架构范式
(神经符号结合)
多智能体系统
• ReAct (2022)
• Auto-GPT / BabyAGI (2023)
• Voyager (2023)
• ChatGPT Agent (2025)
• Google Big Sleep (2024)
推理+行动:ReAct 提出 Reasoning + Action 闭环框架 。
自主循环:Auto-GPT 展示自主分解目标并循环执行的能力 。
终身学习:Voyager 在开放世界中通过代码构建技能库 。
专业应用:Big Sleep 展示了在网络安全领域的自主漏洞发现能力。

AI Agent 技术栈全景 (2024-2025)

得益于大语言模型的突破,智能体技术栈呈现出前所未有的活跃度。下图展示了 Letta 公司发布的 AI Agents Stack
在这里插入图片描述

💡 注解
这张图对于现在的 Agent 开发者来说是藏宝图。它清晰地划分了从底层模型到上层应用的七层架构,你可以根据这个分类来选择你的技术选型。

1. Vertical Agents (垂直领域智能体)

位于顶层,直接面向最终用户,解决特定领域问题。

  • Examples: Decagon (客服), Harvey (法律), MultiOn (浏览器自动化), 11x (数字员工), Factory, Replit.
2. Agent Hosting & Serving (托管与服务)

负责智能体的部署、运行和 API 化,类似 Web 时代的 Hosting。

  • Examples: Assistants API (OpenAI), Amazon Bedrock Agents, LiveKit Agents (实时交互).
3. Observability (可观测性)

用于监控智能体的运行状态、调试 Prompt、追踪调用链 (Tracing) 和成本分析。

  • Examples: LangSmith, Arize, Weave, Langfuse, AgentOps.ai, Braintrust.
4. Agent Frameworks (开发框架)

构建智能体核心逻辑的脚手架,提供编排、状态管理等功能。

  • Examples: LangGraph (图导向控制流), LlamaIndex (数据索引), CrewAI (多智能体编排), AutoGen (微软多智能体框架), Semantic Kernel, DSPy, Phidata.
5. Memory (记忆层)

管理智能体的短期和长期记忆,解决 LLM 上下文限制。

  • Examples: MemGPT, Letta, Zep, LangMem.
6. Tool Libraries & Sandboxes (工具与沙箱)

提供安全的代码执行环境 (Sandbox) 和预构建的工具集 (Toolkits)。

  • Examples: E2B (代码解释器沙箱), Browserbase (无头浏览器), Composio (SaaS 集成), Exa, Modal.
7. Model Serving & Storage (模型服务与存储)

最底层的基础设施,提供 LLM 推理和向量存储。

  • Model Serving: Ollama, LM Studio, vLLM, Groq, OpenAI API, Anthropic, Gemini, Mistral.
  • Storage (Vector DB): Chroma, Pinecone, Weaviate, Supabase, Milvus, Qdrant.

2.5 本章小结

本章回顾了智能体发展的历史脉络,涵盖了 AI 领域几次关键的范式革命 :

  1. 符号主义的探索:从 PSSH 假说出发,我们见证了专家系统的兴起与衰落。通过亲手构建 ELIZA,我们深刻理解了基于规则的系统在面对真实世界时的脆弱性。
  2. 分布式思想的萌芽:明斯基的“心智社会”理论告诉我们,复杂的整体智能可以从简单局部单元的交互中涌现出来,这为多智能体系统提供了哲学基础。
  3. 学习范式的演进:我们见证了从联结主义(神经网络)解决感知问题,到强化学习(RL)解决决策问题,再到预训练(Pre-training)解决知识获取瓶颈的完整过程。
  4. 现代智能体的诞生:最终,LLM 融合了上述所有成果,通过“感知-记忆-规划-工具”的架构,实现了真正的通用智能体。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值