上下文工程

最新推荐文章于 2025-10-08 09:30:00 发布

原创最新推荐文章于 2025-10-08 09:30:00 发布 · 728 阅读

CC 4.0 BY-SA版权

文章标签：

10 篇文章

订阅专栏

“上下文工程”（Context Engineering）是一个在自然语言处理（NLP）、大语言模型（LLM）应用和人工智能系统设计中日益受到关注的概念。它指的是系统性地设计、组织、优化和管理输入上下文（context）的过程，以提升模型理解、推理和生成能力，特别是在复杂任务中。

在大模型语境中，“上下文”通常指：

✅ 例如：在问答系统中，上下文可能是问题本身 + 一段参考文章。

尽管大模型具有强大的语言理解能力，但它们的性能高度依赖于输入上下文的质量和结构。如果上下文混乱、冗余、不完整或误导，模型表现会大幅下降。

👉 所以，上下文工程的目标是“让模型看得更清楚、想得更明白”。

方法	说明	示例
Prompt 设计（Prompt Engineering）	通过精心构造提示词来引导模型行为。	“请用简洁的中文回答以下问题：……”
上下文压缩（Context Compression）	保留关键信息，去除冗余内容。	使用摘要、关键词提取、向量检索等。
检索增强生成（RAG, Retrieval-Augmented Generation）	从外部知识库中动态检索相关信息并注入上下文。	用户问“2023年诺贝尔奖得主是谁？”，系统从数据库中检索最新信息。
分块与结构化上下文	将长文档按逻辑分块，添加标题、编号、摘要。	将技术文档分为“背景”、“方法”、“结果”三部分。
角色设定与元提示（Meta-Prompting）	明确模型角色（如“你是一位专业律师”），增强推理一致性。	“请以资深产品经理的视角分析这个需求。”
少样本学习（Few-shot Prompting）	提供少量示例来“教”模型任务模式。	给出3个问答对后，让模型回答新问题。
思维链（Chain-of-Thought, CoT）	引导模型分步推理，提升复杂任务准确率。	“先分析原因，再给出结论……”
上下文缓存与记忆管理	在多轮对话中高效管理历史信息，避免上下文溢出。	使用向量数据库保存关键对话摘要。