掌握上下文工程，就是掌握Agent的灵魂！从入门到精通全攻略，一篇通收藏够了！

最新推荐文章于 2025-11-27 14:26:48 发布

原创最新推荐文章于 2025-11-27 14:26:48 发布 · 903 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #深度学习 #langchain #chatgpt

这不是我第一次在我的文章里提到上下文工程了，我相信也绝对不会是最后一次。

因为这真的很重要，尤其是对于 Agent 大行其道的今天。知道上下文工程在 Agent 中的运转和作用，绝逼比你去抄别人的 Prompt 来的有用的多。

正好刷到 Latent Space 的一期播客，谈到了上下文工程在 Agent 中的作用，邀请的对象是Lance Martin，也是Langchain 的早期成员。

我整理了这期访谈的重点内容，但是如果有条件的小伙伴，我还是推荐去反复观看这期访谈 5,6,7,8 遍。

01 到底什么是上下文工程

所谓的上下文工程，这个概念其实最早来自Karpathy。他指出上下文工程是：

为 LLM 提供下一步所需的恰到好处的上下文。

那上下文工程和我们日常所说的 Prompt 又有什么不同呢？

区别在于：Prompt 更多是指人类与模型聊天，ChatGPT，所输入的信息。但在 Agent 的使用场景中，Agent 往往处理的信息远不止人类输入的这么点点。

举个例子来说，如果大家用过 Claude Code，或者 Cursor，这类Coding Agent 就会发现，很多时候哪怕即使是处理你简单的一个请求，都会调用很多工具，从而产生巨大的 Token 消耗，也就给模型带来了巨大的上下文负担。

所以，现在整个 AI 圈会一直在探讨的一个问题就是，如何给模型塞入合适的上下文。

因为整个上下文实际上是动态的，它除了包括 System Prompt 和用户输入的 Prompt 之外，还需要处理超过数十次工具调用的结果。

实际生产环境中，一次任务调用工具的次数可以达到几十次，甚至上百次。

「所以不难理解为什么 Claude Code 这么贵了。。。」

Lance 指出，在 Agent 开发的早期，经常会因为粗暴的整合上下文，而导致Token 消耗巨大，比如他在构建 Open Deep Research 这个项目早期的时候，每次运行消耗 50 万 Token，成本达到 1 至 2 美元。

同时，也会导致 Agent 性能表现急剧下滑。

那如何处理这种情况呢？

02 上下文卸载

Lance Martin 提到了 Manus 给出了一个概念，叫上下文卸载。

其实就是将工具调用的全部原始内容存到一个外部系统，按需求检索。千万别非常粗暴的直接塞回上下文消息历史里。

上下文卸载的核心在于保留最简的摘要元数据，确保模型能够理解被卸载的内容。

Lance 拿他做的 Open Deep Research 这个项目来举例。在深度研究场景，可能会卸载完整页面，但真正的困难在于如何生成能准确反映文章内容的高效摘要或简介。

因为这些文章的摘要或者简介往往是决定模型是否需要去读取相关信息的关键因素。

Lance 在Open Deep Research 中是通过精心设计提示词来生成摘要，确保摘要具有高召回率，能够捕获文章中所有的关键点。

同样，Lance 也谈到了上下文卸载在多智能体系统中的运用。

业界比如 Cognition 其实是比较反对多 Agent 系统的。一个主要的原因就是多 Agent 的实现难度比较高，特别是如何向子智能体传递充分的上下文，还有就是在多 Agent 系统中，每个子 Agent 通常会做出互相冲突的决策，如何很好的处理这些决策也是一个问题。

Lance 认为在编码场景使用多 Agent 系统需要非常谨慎，因为每个子 Agent 在创建系统组件时，非常容易在决策上产生冲突。但是在深度研究的场景，使用多 Agent 系统反而就还好。因为在深度研究场景中，每个子 Agent 通过读取操作进行上下文收集，等所有的子智能体工作完成以后，可以基于所有共享的上下文进行整合。

他认为有关多Agent 系统和单 Agent 的争论，也可以称为 AI 工程中苦涩的教训。

03 检索和记忆

检索和记忆在整个 Agent 系统中，我认为是一直被忽略的模块。

Lance 谈到了现在主流的检索方式。第一种就是还是基于 RAG 的方案。

Windsurf 采用了经典的代码分块技术，通过精心设计的语义辩解划分代码块，并将这些分块进行嵌入以实现基于语义相似度的向量搜索与检索。此外，系统还整合了 grep 和知识图谱，通过重排序机制融合多种检索结果，构建出复杂多阶段的 RAG 流程。

相反，Claude Code 采取了截然不同的方案。它采取了 grep 等基础工具调用来遍历文件，完全无需建立检索体系。

Lance 自己特意做了一个实验，来比较这几种方法的效果。

发现 Claude Code 采用的方法确实非常有效。

对于记忆，Lance 认为可以分为记忆写入和记忆读取。

他还是拿 Claude Code举了个例子。在记忆读取上，它会在每次启动时，会载入claude.md 文档；在记忆写入方面，用户需明确指定保存的内容，由 Claude Code 写入 claude.md。

另一个极端是 ChatGPT。它的记忆系统在后台自主决定何时写入和调取记忆。虽然看上去非常丝滑，但是也容易出现失控。

由此可见，如何确定记忆写入的时机与方式仍然值得探讨。不过记忆读取机制与检索功能的结合已经非常成熟。

大规模的记忆检索本质上就是检索。

04 苦涩教训

Lance 提到了自己在做 Open Deep Research 的时候，有一个非常深刻的教训是，他一开始才用了一种高度结构化的工作流程，刻意规避工具调用功能。

这源自于它 2004 年的经验。

但是现在的 LLM 早已和当年不能比了。这种方案反而会成为瓶颈，阻碍了他对 MCP 这种新兴技术的运用，也无法充分利用工具调用功能改进。

还有一个教训出现在它让子 Agent 独立撰写报告时，出现了内容割裂。也就是之前提到过的多 Agent 之间出现了通信问题，所以它取消了子 Agent 独立写作的环节，实施单次生成报告机制。

所以，其实所谓苦涩的教训，指的就是，随着模型能力不断飞升，我们在构建 AI 产品时，也要不断去重新考量当前方案的可行性。

如何学习大模型 AI ？

我国在AI大模型领域面临人才短缺，数量与质量均落后于发达国家。2023年，人才缺口已超百万，凸显培养不足。随着Al技术飞速发展，预计到2025年，这一缺口将急剧扩大至400万，严重制约我国Al产业的创新步伐。加强人才培养，优化教育体系，国际合作并进，是破解困局、推动AI发展的关键。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

2025最新大模型学习路线

明确的学习路线至关重要。它能指引新人起点、规划学习顺序、明确核心知识点。大模型领域涉及的知识点非常广泛，没有明确的学习路线可能会导致新人感到迷茫，不知道应该专注于哪些内容。

对于从来没有接触过AI大模型的同学，我帮大家准备了从零基础到精通学习成长路线图以及学习规划。可以说是最科学最系统的学习路线。

在这里插入图片描述

针对以上大模型的学习路线我们也整理了对应的学习视频教程，和配套的学习资料。

大模型经典PDF书籍

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路！

在这里插入图片描述

配套大模型项目实战

所有视频教程所涉及的实战项目和项目源码等
在这里插入图片描述

博主介绍＋AI项目案例集锦

MoPaaS专注于Al技术能力建设与应用场景开发，与智学优课联合孵化，培养适合未来发展需求的技术性人才和应用型领袖。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

为什么要学习大模型？

2025人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

在这里插入图片描述

适合人群

在校学生：包括专科、本科、硕士和博士研究生。学生应具备扎实的编程基础和一定的数学基础，有志于深入AGI大模型行业，希望开展相关的研究和开发工作。
IT行业从业人员：包括在职或失业者，涵盖开发、测试、运维、产品经理等职务。拥有一定的IT从业经验，至少1年以上的编程工作经验，对大模型技术感兴趣或有业务需求，希望通过课程提升自身在IT领域的竞争力。
IT管理及技术研究领域人员：包括技术经理、技术负责人、CTO、架构师、研究员等角色。这些人员需要跟随技术发展趋势，主导技术创新，推动大模型技术在企业业务中的应用与改造。
传统AI从业人员：包括算法工程师、机器视觉工程师、深度学习工程师等。这些AI技术人才原先从事机器视觉、自然语言处理、推荐系统等领域工作，现需要快速补充大模型技术能力，获得大模型训练微调的实操技能，以适应新的技术发展趋势。

课程精彩瞬间

大模型核心原理与Prompt：掌握大语言模型的核心知识，了解行业应用与趋势；熟练Python编程，提升提示工程技能，为Al应用开发打下坚实基础。

RAG应用开发工程：掌握RAG应用开发全流程，理解前沿技术，提升商业化分析与优化能力，通过实战项目加深理解与应用。

Agent应用架构进阶实践：掌握大模型Agent技术的核心原理与实践应用，能够独立完成Agent系统的设计与开发，提升多智能体协同与复杂任务处理的能力，为AI产品的创新与优化提供有力支持。

模型微调与私有化大模型：掌握大模型微调与私有化部署技能，提升模型优化与部署能力，为大模型项目落地打下坚实基础。

顶尖师资，深耕AI大模型前沿技术

实战专家亲授，让你少走弯路
在这里插入图片描述

一对一学习规划，职业生涯指导

真实商业项目实训
大厂绿色直通车

人才库优秀学员参与真实商业项目实训

以商业交付标准作为学习标准，具备真实大模型项目实践操作经验可写入简历，支持项目背调

大厂绿色直通车，冲击行业高薪岗位

文中涉及到的完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

掌握上下文工程，就是掌握Agent的灵魂！从入门到精通全攻略，一篇通收藏够了！

01 到底什么是上下文工程

02 上下文卸载

03 检索和记忆

04 苦涩教训

如何学习大模型 AI ？

2025最新大模型学习路线

大模型经典PDF书籍

配套大模型项目实战

博主介绍＋AI项目案例集锦

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

为什么要学习大模型？

适合人群

课程精彩瞬间

顶尖师资，深耕AI大模型前沿技术

一对一学习规划，职业生涯指导

文中涉及到的完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【`保证100%免费`】

文中涉及到的完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【`保证100%免费`】