我们在前几篇中深入了微观的技术细节,现在我们需要回答一个宏观问题:我们是如何从 1950 年代的逻辑符号,一步步走到今天这个“大模型+智能体”的时代的?
2.4.5 智能体发展关键节点概览
人工智能体的发展史并非一条笔直的单行道,而是几大核心思想流派长达半个多世纪交织、竞争与融合的历程。主要有三大思潮主导着不同时期的研究范式 :
- 符号主义 (Symbolism):
- 代表人物:司马贺 (Herbert A. Simon)、明斯基 (Marvin Minsky)。
- 核心思想:智能的核心在于对符号的操作与逻辑推理。
- 产物:SHRDLU、专家系统、深蓝 (Deep Blue)。
- 联结主义 (Connectionism):
- 代表人物:杰弗里·辛顿 (Geoffrey Hinton) 等。
- 核心思想:源于对大脑神经网络的模拟。
- 产物:反向传播算法、卷积神经网络 (CNN)、Transformer。
- 行为主义 (Behaviorism):
- 核心思想:强调智能体通过与环境的互动和试错来学习最优策略(现代化身为强化学习)。
- 产物:TD-Gammon、AlphaGo。
💡 深度解析:大融合 (The Great Convergence)
进入 21 世纪 20 年代,这些流派以前所未有的方式深度融合:
GPT-4 (联结主义) 作为大脑,执行 CoT (符号推理),并调用 Tools (行为/动作)。这就是现代智能体架构的本质——神经-符号结合 (Neuro-Symbolic Integration)。
智能体发展演进时间线
下图梳理了从 20 世纪 50 年代至今的关键理论、项目与事件,展示了技术如何一步步演进 :
| 时期 (Era) | 核心思想/流派 | 关键智能体/项目/技术 | 核心贡献 (Core Contribution) |
|---|---|---|---|
| 符号主义时期 (1950-1970) | 符号主义 (Symbolism) | • 逻辑理论家 (Logic Theorist, 1956) • 通用问题求解器 (GPS, 1959) • 机器人 Shakey (1966-1972) | • 符号推理可行性:验证了机器执行形式化符号推理的可行性 。 • 手段-目的分析:GPS 引入了 Means-Ends Analysis,为目标驱动规划奠定基础 。 • 具身智能先驱:Shakey 是首个集成感知、推理与物理交互的移动机器人 。 |
| 专家系统与联结主义复苏 (1980s) | 符号主义 联结主义 | • 专家系统 (MYCIN, XCON) • 反向传播算法 (Backprop) | • 知识工程:将领域专家知识编码为规则库,使系统在特定领域辅助决策 。 • 神经网络复苏:反向传播为训练多层神经网络提供了有效方法,奠定了学习能力的基础 。 |
| 第二次 AI 低谷与新起点 (1990-2000) | 符号主义 联结主义 行为主义 | • 深蓝 (Deep Blue, 1997) • LeNet-5 (1998) • TD-Gammon (1992) • Q-Learning (1989) | • 搜索与规划:深蓝通过大规模搜索在国际象棋领域达到顶尖水平 。 • 特征学习:CNN (LeNet-5) 实现从原始像素自动学习特征。 • 自博弈与 RL:TD-Gammon 证明智能体可通过自博弈达到高水平;Q-Learning 提升了无模型 RL 的灵活性。 |
| 深度学习时代 (2010s) | 联结主义 行为主义 | • AlexNet (2012) • DQN (2013) • AlphaGo (2016) • Transformer (2017) | • 视觉爆发:AlexNet 推动深度学习在图像识别领域的广泛应用 。 • 端到端控制:DQN 将深度学习与 RL 结合,直接从像素学习策略。 • 神经符号典范:AlphaGo 结合 DL、RL 与蒙特卡洛树搜索 (MCTS)。 • 注意力机制:Transformer 成为现代 LLM 的标准架构 。 |
| 大模型时代 (2020-2022) | LLM 驱动 | • GPT-3 (2020) • 思维链 (CoT, 2022) | • 少样本学习:展示了作为通用智能基础模型的潜力 (Few-shot) 。 • 推理增强:CoT 通过生成中间推理步骤,显著提升复杂逻辑任务的表现。 |
| 智能体时代 (2023 至今) | 智能体架构范式 (神经符号结合) 多智能体系统 | • ReAct (2022) • Auto-GPT / BabyAGI (2023) • Voyager (2023) • ChatGPT Agent (2025) • Google Big Sleep (2024) | • 推理+行动:ReAct 提出 Reasoning + Action 闭环框架 。 • 自主循环:Auto-GPT 展示自主分解目标并循环执行的能力 。 • 终身学习:Voyager 在开放世界中通过代码构建技能库 。 • 专业应用:Big Sleep 展示了在网络安全领域的自主漏洞发现能力。 |
AI Agent 技术栈全景 (2024-2025)
得益于大语言模型的突破,智能体技术栈呈现出前所未有的活跃度。下图展示了 Letta 公司发布的 AI Agents Stack 。

💡 注解:
这张图对于现在的 Agent 开发者来说是藏宝图。它清晰地划分了从底层模型到上层应用的七层架构,你可以根据这个分类来选择你的技术选型。
1. Vertical Agents (垂直领域智能体)
位于顶层,直接面向最终用户,解决特定领域问题。
- Examples: Decagon (客服), Harvey (法律), MultiOn (浏览器自动化), 11x (数字员工), Factory, Replit.
2. Agent Hosting & Serving (托管与服务)
负责智能体的部署、运行和 API 化,类似 Web 时代的 Hosting。
- Examples: Assistants API (OpenAI), Amazon Bedrock Agents, LiveKit Agents (实时交互).
3. Observability (可观测性)
用于监控智能体的运行状态、调试 Prompt、追踪调用链 (Tracing) 和成本分析。
- Examples: LangSmith, Arize, Weave, Langfuse, AgentOps.ai, Braintrust.
4. Agent Frameworks (开发框架)
构建智能体核心逻辑的脚手架,提供编排、状态管理等功能。
- Examples: LangGraph (图导向控制流), LlamaIndex (数据索引), CrewAI (多智能体编排), AutoGen (微软多智能体框架), Semantic Kernel, DSPy, Phidata.
5. Memory (记忆层)
管理智能体的短期和长期记忆,解决 LLM 上下文限制。
- Examples: MemGPT, Letta, Zep, LangMem.
6. Tool Libraries & Sandboxes (工具与沙箱)
提供安全的代码执行环境 (Sandbox) 和预构建的工具集 (Toolkits)。
- Examples: E2B (代码解释器沙箱), Browserbase (无头浏览器), Composio (SaaS 集成), Exa, Modal.
7. Model Serving & Storage (模型服务与存储)
最底层的基础设施,提供 LLM 推理和向量存储。
- Model Serving: Ollama, LM Studio, vLLM, Groq, OpenAI API, Anthropic, Gemini, Mistral.
- Storage (Vector DB): Chroma, Pinecone, Weaviate, Supabase, Milvus, Qdrant.
2.5 本章小结
本章回顾了智能体发展的历史脉络,涵盖了 AI 领域几次关键的范式革命 :
- 符号主义的探索:从 PSSH 假说出发,我们见证了专家系统的兴起与衰落。通过亲手构建 ELIZA,我们深刻理解了基于规则的系统在面对真实世界时的脆弱性。
- 分布式思想的萌芽:明斯基的“心智社会”理论告诉我们,复杂的整体智能可以从简单局部单元的交互中涌现出来,这为多智能体系统提供了哲学基础。
- 学习范式的演进:我们见证了从联结主义(神经网络)解决感知问题,到强化学习(RL)解决决策问题,再到预训练(Pre-training)解决知识获取瓶颈的完整过程。
- 现代智能体的诞生:最终,LLM 融合了上述所有成果,通过“感知-记忆-规划-工具”的架构,实现了真正的通用智能体。
172万+

被折叠的 条评论
为什么被折叠?



