上下文工程是什么?AI智能体落地的关键技术一文讲透

随着大语言模型(LLM)能力的不断跃升,AI 智能体正在从纯对话系统迈向更复杂的多轮推理、多工具协同与长期任务执行。

而支撑这一演化的“幕后主角”,正是一个技术门槛日益提升的新领域:上下文工程(Context Engineering)。继 Vibe Coding(氛围编程)火了之后,AI圈又迎来一股新的技术热潮。

这一次,是由前特斯拉 AI 总监、深度学习布道者 Andrej Karpathy 亲自点燃的火。他在一次演讲中强调:“如果你想真正掌控一个大语言模型的行为,不是去微调权重,而是掌控它的‘心智世界’——你提供给它的上下文。”

图片

在构建 AI 智能体的过程中,“上下文”不仅仅是几个提示词的组合,更是构成其“认知宇宙”的核心素材。它包含模型当前能“看到”的信息(如任务指令、外部知识、历史轨迹),也决定了模型“如何看到”(结构化与否)、“何时看到”(静态注入或动态更新)。

正如 Andrej Karpathy 所说:“LLM 是新的计算平台,模型本体就像 CPU,而上下文窗口就像 RAM。你无法重新训练模型每次适配具体任务,但你可以用上下文工程去控制它‘思考的材料’。”

于是,一个全新的工程范式被推上风口浪尖: Context Engineering(上下文工程)

在这里插入图片描述

图片

上下文工程是一门集艺术与科学于一体的学问,目标是高效填充 LLM 的上下文窗口,使其在每一步任务执行中都拥有“刚刚好”的信息量。它不仅涉及信息的选择、组织与注入方式,还关注上下文的动态性、可扩展性与准确性。

图片

具体而言,构建 AI 智能体过程中所涉及的上下文类型包括:

  • 指令:提示词、少样本示例、工具描述、系统角色设定等;
  • 知识:结构化事实、外部知识库(通过RAG注入)或语义记忆;
  • 工具反馈:函数调用、API 返回值、插件响应等多模态中间结果;
  • 历史轨迹:对话上下文、用户输入记录、策略路径等。

图片

由于 LLM 的上下文窗口资源有限(即使扩展至百万 tokens 也依旧存在边界),不加选择地注入上下文将导致成本上升、响应延迟、性能退化甚至幻觉增强。因此,对上下文的管理与设计,必须借助系统化策略。

四大上下文工程策略详解:写、选、压缩、隔离。

图片

图片

1. 写上下文(Write Context)

写上下文是指将关键任务信息保存在上下文窗口之外,但又可被模型间接利用的手段,类似人类“写便签”、“做笔记”的行为。

  • 便签(Scratchpads):Anthropic 提出的研究显示,AI 智能体通过工具调用或状态字段记录计划信息,可帮助其在任务过程中持久化策略、参数或状态。例如,研究人员将超过 20 万 tokens 的长任务拆解为阶段性步骤,并通过便签记录每一阶段决策,从而避免窗口溢出。

  • 记忆(Memory):指 AI 智能体自动从多轮历史对话中提取高价值事实(语义记忆)、行为流程(程序记忆)、案例轨迹(情景记忆)并长期保留。这一机制已被 ChatGPT、Cursor、Windsurf 等集成,用于实现“个性化响应”。如 ChatGPT 能记住用户的写作风格和工作场景,并在未来会话中主动融合。

    图片

2. 选上下文(Select Context)

选上下文是将最相关的信息拉入当前上下文窗口。它是上下文工程中最典型的动态部分,涵盖便签、记忆、工具与知识四种维度:

  • 记忆选择:如 Claude Code 使用 CLAUDE.md 文件、Cursor 使用 config rules,用于提供始终注入的规则性知识。对于海量语义记忆,ChatGPT 结合知识图谱与向量索引过滤调用内容,但仍存在“意外注入”问题(如 Simon Willison 遭遇 AI 自动泄露位置信息)。

    图片

  • 工具选择:大模型面对多种工具时,可能会因描述相似产生混淆。RAG-MCP 架构通过将工具说明索引入库,仅检索任务相关的工具描述,实验证明工具选择准确率提高 3 倍。

  • 知识选择(RAG):以 Windsurf 为例,其代码 RAG 架构并非简单做文本嵌入,而是结合 AST 分块、语义重排、多源索引等手段,在千万行代码中快速定位任务相关逻辑模块,从而大幅提升智能体响应的专业度。

3. 压缩上下文(Compress Context)

压缩上下文用于精简冗余 tokens,通过“摘要”和“修剪”两类方式实现:

  • 上下文摘要(Summarization):Claude Code 在上下文窗口使用率达到 95% 后会自动对对话轨迹进行总结,再替代注入。这种方式可以采用递归摘要、层次摘要等策略,也可以训练微调模型用于关键事件提取。

    图片

  • 上下文修剪(Trimming):使用规则剔除老旧、无效或冲突上下文。例如清除最早回合信息、剔除中间无关路径等。这种策略操作简便,在工具调用频繁或成本敏感场景中尤为常用。

4. 隔离上下文(Isolate Context)

隔离上下文是将任务上下文拆分为多个“独立空间”,实现多 Agent 协作、环境分区或状态模块化:

图片

  • 多智能体架构(Multi-Agent):如 OpenAI Swarm 和 Anthropic 多智能体团队研究,每个子 Agent 管理自己的上下文、工具与指令,适用于分布式复杂任务。实验显示,相较单体 Agent,这种模式响应准确率显著提高,尽管 token 使用量高达单 Agent 的 15 倍。
  • 环境隔离(Environment Isolation):Hugging Face CodeAgent 架构将代码工具执行放入沙箱环境,工具调用参数与返回值在沙箱中完成状态隔离,仅返回结果注入 LLM,从而防止上下文污染。
  • 运行时状态对象(State Object):以 LangGraph 为例,系统状态由结构化字段组成。开发者可精确控制哪些字段在每步注入模型,哪些信息保持隔离,仅在特定回合暴露,从而实现“动态上下文管理”。

上下文工程已逐步成为 AI 智能体设计的核心工程分支。无论是 Anthropic 的研究,OpenAI 的产品落地,还是 LangChain/LangGraph 等开发框架的演进,都在强调一个趋势:

上下文,不只是提示词,它是智能体的“工作内存”、“知识总线”与“行为约束”。

未来,随着工具生态扩张、多模态输入爆发与任务持续增长,AI 智能体的上下文管理将走向更自动化、更智能、更语义化。

Context Engineering 将从人工手工选择,进化为“智能上下文调度器”,成为每一个 AI 开发者的核心能力之一。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值