Chapter 2: 智能体发展史 (Part 6: 技术全景与历史脉络）

原创于 2026-01-06 10:00:00 发布 · 1.8k 阅读

42 ·

CC 4.0 BY-SA版权

文章标签：

#agent #LLM

Agent 专栏收录该内容

18 篇文章

订阅专栏

我们在前几篇中深入了微观的技术细节，现在我们需要回答一个宏观问题：我们是如何从 1950 年代的逻辑符号，一步步走到今天这个“大模型+智能体”的时代的？

2.4.5 智能体发展关键节点概览

人工智能体的发展史并非一条笔直的单行道，而是几大核心思想流派长达半个多世纪交织、竞争与融合的历程。主要有三大思潮主导着不同时期的研究范式：

符号主义 (Symbolism)：

代表人物：司马贺 (Herbert A. Simon)、明斯基 (Marvin Minsky)。
核心思想：智能的核心在于对符号的操作与逻辑推理。
产物：SHRDLU、专家系统、深蓝 (Deep Blue)。

联结主义 (Connectionism)：

代表人物：杰弗里·辛顿 (Geoffrey Hinton) 等。
核心思想：源于对大脑神经网络的模拟。
产物：反向传播算法、卷积神经网络 (CNN)、Transformer。

行为主义 (Behaviorism)：

核心思想：强调智能体通过与环境的互动和试错来学习最优策略（现代化身为强化学习）。
产物：TD-Gammon、AlphaGo。

💡 深度解析：大融合 (The Great Convergence)
进入 21 世纪 20 年代，这些流派以前所未有的方式深度融合：
GPT-4 (联结主义) 作为大脑，执行 CoT (符号推理)，并调用 Tools (行为/动作)。这就是现代智能体架构的本质——神经-符号结合 (Neuro-Symbolic Integration)。

智能体发展演进时间线

下图梳理了从 20 世纪 50 年代至今的关键理论、项目与事件，展示了技术如何一步步演进：

时期 (Era)	核心思想/流派	关键智能体/项目/技术	核心贡献 (Core Contribution)
符号主义时期 (1950-1970)	符号主义 (Symbolism)	• 逻辑理论家 (Logic Theorist, 1956) • 通用问题求解器 (GPS, 1959) • 机器人 Shakey (1966-1972)	• 符号推理可行性：验证了机器执行形式化符号推理的可行性。 • 手段-目的分析：GPS 引入了 Means-Ends Analysis，为目标驱动规划奠定基础。 • 具身智能先驱：Shakey 是首个集成感知、推理与物理交互的移动机器人。
专家系统与联结主义复苏 (1980s)	符号主义联结主义	• 专家系统 (MYCIN, XCON) • 反向传播算法 (Backprop)	• 知识工程：将领域专家知识编码为规则库，使系统在特定领域辅助决策。 • 神经网络复苏：反向传播为训练多层神经网络提供了有效方法，奠定了学习能力的基础。
第二次 AI 低谷与新起点 (1990-2000)	符号主义联结主义行为主义	• 深蓝 (Deep Blue, 1997) • LeNet-5 (1998) • TD-Gammon (1992) • Q-Learning (1989)	• 搜索与规划：深蓝通过大规模搜索在国际象棋领域达到顶尖水平。 • 特征学习：CNN (LeNet-5) 实现从原始像素自动学习特征。 • 自博弈与 RL：TD-Gammon 证明智能体可通过自博弈达到高水平；Q-Learning 提升了无模型 RL 的灵活性。
深度学习时代 (2010s)	联结主义行为主义	• AlexNet (2012) • DQN (2013) • AlphaGo (2016) • Transformer (2017)	• 视觉爆发：AlexNet 推动深度学习在图像识别领域的广泛应用。 • 端到端控制：DQN 将深度学习与 RL 结合，直接从像素学习策略。 • 神经符号典范：AlphaGo 结合 DL、RL 与蒙特卡洛树搜索 (MCTS)。 • 注意力机制：Transformer 成为现代 LLM 的标准架构。
大模型时代 (2020-2022)	LLM 驱动	• GPT-3 (2020) • 思维链 (CoT, 2022)	• 少样本学习：展示了作为通用智能基础模型的潜力 (Few-shot) 。 • 推理增强：CoT 通过生成中间推理步骤，显著提升复杂逻辑任务的表现。
智能体时代 (2023 至今)	智能体架构范式 (神经符号结合) 多智能体系统	• ReAct (2022) • Auto-GPT / BabyAGI (2023) • Voyager (2023) • ChatGPT Agent (2025) • Google Big Sleep (2024)	• 推理+行动：ReAct 提出 Reasoning + Action 闭环框架。 • 自主循环：Auto-GPT 展示自主分解目标并循环执行的能力。 • 终身学习：Voyager 在开放世界中通过代码构建技能库。 • 专业应用：Big Sleep 展示了在网络安全领域的自主漏洞发现能力。

AI Agent 技术栈全景 (2024-2025)

得益于大语言模型的突破，智能体技术栈呈现出前所未有的活跃度。下图展示了 Letta 公司发布的 AI Agents Stack 。
在这里插入图片描述

💡 注解：
这张图对于现在的 Agent 开发者来说是藏宝图。它清晰地划分了从底层模型到上层应用的七层架构，你可以根据这个分类来选择你的技术选型。

1. Vertical Agents (垂直领域智能体)

位于顶层，直接面向最终用户，解决特定领域问题。

Examples: Decagon (客服), Harvey (法律), MultiOn (浏览器自动化), 11x (数字员工), Factory, Replit.

2. Agent Hosting & Serving (托管与服务)

负责智能体的部署、运行和 API 化，类似 Web 时代的 Hosting。

Examples: Assistants API (OpenAI), Amazon Bedrock Agents, LiveKit Agents (实时交互).

3. Observability (可观测性)

用于监控智能体的运行状态、调试 Prompt、追踪调用链 (Tracing) 和成本分析。

Examples: LangSmith, Arize, Weave, Langfuse, AgentOps.ai, Braintrust.

4. Agent Frameworks (开发框架)

构建智能体核心逻辑的脚手架，提供编排、状态管理等功能。

Examples: LangGraph (图导向控制流), LlamaIndex (数据索引), CrewAI (多智能体编排), AutoGen (微软多智能体框架), Semantic Kernel, DSPy, Phidata.

5. Memory (记忆层)

管理智能体的短期和长期记忆，解决 LLM 上下文限制。

Examples: MemGPT, Letta, Zep, LangMem.

6. Tool Libraries & Sandboxes (工具与沙箱)

提供安全的代码执行环境 (Sandbox) 和预构建的工具集 (Toolkits)。

Examples: E2B (代码解释器沙箱), Browserbase (无头浏览器), Composio (SaaS 集成), Exa, Modal.

7. Model Serving & Storage (模型服务与存储)

最底层的基础设施，提供 LLM 推理和向量存储。

Model Serving: Ollama, LM Studio, vLLM, Groq, OpenAI API, Anthropic, Gemini, Mistral.
Storage (Vector DB): Chroma, Pinecone, Weaviate, Supabase, Milvus, Qdrant.

2.5 本章小结

本章回顾了智能体发展的历史脉络，涵盖了 AI 领域几次关键的范式革命：

符号主义的探索：从 PSSH 假说出发，我们见证了专家系统的兴起与衰落。通过亲手构建 ELIZA，我们深刻理解了基于规则的系统在面对真实世界时的脆弱性。
分布式思想的萌芽：明斯基的“心智社会”理论告诉我们，复杂的整体智能可以从简单局部单元的交互中涌现出来，这为多智能体系统提供了哲学基础。
学习范式的演进：我们见证了从联结主义（神经网络）解决感知问题，到强化学习（RL）解决决策问题，再到预训练（Pre-training）解决知识获取瓶颈的完整过程。
现代智能体的诞生：最终，LLM 融合了上述所有成果，通过“感知-记忆-规划-工具”的架构，实现了真正的通用智能体。