【收藏必备】AI大模型提示词工程：无需修改参数，优化输入即可提升效能

最新推荐文章于 2025-10-24 11:18:08 发布

原创最新推荐文章于 2025-10-24 11:18:08 发布 · 1.3k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型 #语言模型 #ai #程序员 #转行 #学习

部署运行你感兴趣的模型镜像

提示词工程是解锁大模型能力的核心技术——它无需修改模型参数，仅通过优化输入方式，就能让大模型更精准、高效地完成任务。无论是通用对话、专业文档生成，还是复杂推理任务，优质的提示词都能让大模型的输出质量提升50%以上。本教程将从基础框架出发，逐步讲解提示词设计技巧、推理模型适配方法，最终落地到实战应用，帮助你系统掌握提示词工程。

一、提示词工程基础：核心框架与要素

构建有效的提示词，首先需要掌握“结构化框架”——它能让大模型清晰理解任务目标、约束条件和输出要求，避免因需求模糊导致的无效输出。

1.1 提示词六要素框架（必学基础）

提示词的核心是“让大模型明确‘做什么、为什么做、怎么做’”，以下六个要素是所有优质提示词的基础，缺一不可：

要素（Element）	核心含义	示例（以“生成产品使用手册”为例）
任务目标（Object）	明确大模型要完成的具体任务，避免模糊表述	“生成一款智能手环的使用手册，覆盖开机设置、功能操作、常见问题3个模块”
上下文（Context）	提供任务背景信息，限定讨论范围	“该智能手环面向中老年用户，需避开专业术语；支持心率监测、睡眠分析、久坐提醒功能”
角色（Role）	定义大模型的身份/语气，约束输出风格	“你是专业的产品文档工程师，语言需简洁易懂，步骤清晰，符合中老年用户阅读习惯”
受众（Audience）	明确输出内容的目标用户，匹配内容深度	“受众为50-70岁中老年用户，对智能设备操作不熟悉，需用‘一步一图’的简化表述”
样例（Sample）	提供参考案例，让大模型对齐格式/风格	“【样例：开机设置步骤】 1. 长按侧面电源键3秒，屏幕亮起即开机； 2. 选择语言：按上下键切换至‘中文’，按确认键确认”
输出格式（Output Format）	规定输出的结构、类型，明确“不输出什么”	“输出格式要求： 1. 分3个章节，每章节配二级标题（如‘1. 开机设置’）； 2. 操作步骤用数字序号，每步不超过20字； 3. 不包含技术参数（如芯片型号、电池容量）”

1.2 辅助思维范式：让需求更精准

除了六要素，还可结合经典问题分析方法，进一步细化需求，尤其适合复杂任务（如问题诊断、方案设计）：

SWOT分析法：用于“任务风险评估”，例如“生成市场推广方案时，需先分析产品的优势（S）、劣势（W）、机会（O）、威胁（T）”；
5W2H分析法：用于“任务拆解”，例如“设计用户调研问卷时，需明确Who（调研对象）、What（调研内容）、When（调研时间）、Where（调研渠道）、Why（调研目的）、How（调研方式）、How much（样本量）”；
阿里云百炼提示词优化工具：若对提示词设计不熟悉，可使用该工具自动补全要素、优化表述（需在阿里云百炼平台调用）。

在这里插入图片描述

二、提示词模板：标准化应用的关键

在开发大模型应用时，直接让用户写提示词效率低、质量不稳定——提示词模板能解决这一问题：它预设固定要素（如角色、输出格式），仅保留动态参数（如用户输入的任务内容），让开发者通过“填空”快速生成标准化提示词。

2.1 模板设计原则

固定不变的内容预设：角色、输出格式、注意事项等通用规则提前写死；
动态内容用占位符标识：用{{变量名}}表示需要用户输入的部分；
添加约束说明：明确“不允许的输出”，避免大模型偏离方向。

2.2 实战模板示例（以“员工咨询意图分类”为例）

该模板用于企业客服场景，将用户咨询分为“薪资问题”“考勤问题”“福利问题”三类，输出结构化结果以便下游系统处理：

# 提示词模板：员工咨询意图分类
角色：你是企业客服意图识别专家，仅专注于员工咨询的分类任务，不回答具体问题。
任务目标：将员工的咨询内容{{员工咨询文本}}分为以下3类之一：
1. 薪资问题：涉及工资计算、发放时间、奖金规则的咨询；
2. 考勤问题：涉及打卡、请假、加班记录的咨询；
3. 福利问题：涉及社保、公积金、年假的咨询。

输出格式要求：
{
"咨询文本": "{{员工咨询文本}}",
"意图类别": "上述3类之一",
"分类依据": "简要说明分类理由，不超过50字"
}

注意事项：
1. 若咨询内容包含多类信息，按“主要需求”分类；
2. 不输出任何额外解释，仅返回上述JSON格式。

# 示例
当{{员工咨询文本}}为“这个月工资怎么比上个月少了200元？”时，输出：
{
"咨询文本": "这个月工资怎么比上个月少了200元？",
"意图类别": "薪资问题",
"分类依据": "咨询内容涉及工资金额差异，属于薪资计算范畴"
}

使用时，只需将{{员工咨询文本}}替换为实际内容（如“我想申请下周三的年假，需要走什么流程？”），即可快速得到标准化分类结果。

三、进阶技巧：让提示词效果翻倍

掌握基础框架后，通过以下技巧可进一步提升提示词的精准度，尤其适用于复杂任务（如代码调试、数学解题、文档审阅）。

3.1 用分隔符明确边界，避免混淆

分隔符的核心作用是“帮大模型区分‘指令’和‘待处理内容’”，避免大模型将待处理文本误判为指令。常用分隔符及场景：

分隔符类型	示例	适用场景
符号分隔符	`【】` 、`<< >>`、`###`	标识关键要素（如任务目标、样例）
段落分隔符	`===` 、`---`	分隔不同模块（如上下文和输出格式）
XML标签	`<context></context>` 、`<sample></sample>`	结构化强的任务（如文档提取、代码生成）

注意：若提示词中已大量使用某类符号（如产品文档中常用【】标注注意事项），需换用其他分隔符（如<< >>），避免混淆。

示例：用XML标签分隔“待审阅文档”和“审阅要求”

任务：审阅以下产品需求文档，找出“功能描述不明确”的部分。
<review_content>
【产品需求】智能水杯功能描述：
1. 支持水质检测；
2. 提醒用户喝水；
3. 连接手机APP。
</review_content>

<review_requirements>
1. 每个功能需明确“触发条件”（如“何时提醒喝水”）；
2. 标注不明确的部分，用“→”补充建议；
3. 输出格式：分点列出问题及建议。
</review_requirements>

3.2 限定角色和受众，匹配输出风格

角色（Role）：决定大模型的“专业度”和“语气”。例如：

生成学术论文时，角色设为“某领域研究员，熟悉APA引用格式”；
撰写儿童故事时，角色设为“儿童文学作家，语言简单，多使用拟声词”。

受众（Audience）：决定输出的“深度”和“术语密度”。例如：

向程序员解释API时，受众设为“5年经验的后端工程师”，可使用“接口熔断”“幂等性”等术语；
向普通用户解释API时，受众设为“无技术背景的用户”，需用“相当于两个软件的‘沟通桥梁’”等通俗表述。

示例：角色+受众组合的提示词

角色：你是初中物理老师，教学风格生动，擅长用生活案例解释公式。
受众：初二学生，刚学完“压强”概念。
任务：用“书包背带”“钉子钉木板”两个案例，解释压强公式P=F/S，不超过300字。

3.3 强制结构化输出，适配下游系统

大模型默认输出连续文本，但开发应用时（如数据入库、对接CRM系统），常需要JSON、CSV、Markdown等结构化格式。只需在提示词中明确格式要求，大模型即可精准生成。

示例：生成CSV格式的用户反馈统计

任务：将以下用户反馈按“问题类型”统计次数，输出CSV格式。
<feedback_list>
1. APP闪退；2. 登录失败；3. APP闪退；4. 付款页面卡顿；5. 登录失败；6. 注册收不到验证码
</feedback_list>

输出格式：CSV（第一行为表头，包含“问题类型”“次数”），不输出任何额外内容。

预期输出：

问题类型,次数
APP闪退,2
登录失败,2
付款页面卡顿,1
注册收不到验证码,1

3.4 提供少样本示例（Few-shot），对齐风格

当需要大模型输出“固定风格/结构”的内容时（如品牌Slogan、周报模板），仅靠格式描述不够，需提供1-3个样例，让大模型“照葫芦画瓢”。

示例：生成手机品牌Slogan（要求：8字以内，突出“续航”）

任务：为某国产手机品牌生成Slogan，核心突出“续航强”，要求8字以内，语言简洁有力。
样例：
1. 续航无忧，全天在线；
2. 一次充电，两天够用。

请生成3个符合要求的Slogan，分点列出。

预期输出：

长续航，放心用；
充电一次，全天续航；
强续航，无焦虑。

3.5 给模型“思考时间”：思维链（CoT）技巧

对于复杂任务（如数学解题、逻辑推理），直接让大模型输出答案易出错——思维链（Chain of Thought） 能引导大模型“分步思考”，通过输出中间步骤，降低推理误差。

示例：用CoT解决数学题

任务：小明有5个苹果，妈妈又买了3袋苹果，每袋4个，现在小明一共有多少个苹果？
要求：先列出解题步骤，再计算结果，不跳过任何环节。

# 思考过程
步骤1：计算妈妈买的苹果总数——每袋4个，共3袋，总数=3×4=12个；
步骤2：计算小明现有的苹果总数——原有5个+妈妈买的12个=17个；
结果：小明现在一共有17个苹果。

注意：通用大模型需明确要求“输出步骤”，而推理模型（如Qwen2.5-Math、GPT-4 Turbo）默认会输出思考过程，无需额外提示。

四、推理模型vs通用模型：适配与选择

大模型分为“通用模型”和“推理模型”两类，它们的设计目标、输出特征差异显著，需针对性设计提示词。

4.1 两类模型核心差异对比

对比维度	推理模型（如Qwen2.5-Math、DeepSeek-R1）	通用模型（如Qwen2.5-Max、GPT-3.5）
设计目标	专注逻辑推理、多步计算、代码调试等复杂任务	面向对话、文本生成、知识问答等通用场景
训练数据	侧重数学题解、代码逻辑、科学推理数据集	覆盖百科、文学、日常对话等多领域数据
输出特征	包含完整推导步骤，逻辑链条清晰	输出简洁直接，侧重结果表达
响应速度	复杂任务响应慢（需多步计算）	常规任务响应快（单步生成）
成本	推理成本较高（token单价约为通用模型的1.5-2倍）	成本较低，适合批量处理

4.2 模型选择指南

任务类型	推荐模型	理由
日常对话、文案生成、简单问答	通用模型	响应快、成本低，满足基础需求
数学解题、代码调试、法律案例分析	推理模型	需分步推理，降低错误率
模糊任务（信息少、需求不明确）	推理模型	能主动补全信息，推导合理方案
“大海捞针”任务（从海量文本提取关键信息）	推理模型	擅长筛选、关联信息，精准定位
时间/成本敏感的批量任务（如批量分类）	通用模型	效率高，成本可控

4.3 推理模型专属提示词技巧

推理模型虽擅长复杂任务，但仍需优化提示词以保证质量：

保持任务简洁，补充足够背景：避免冗余指令，重点说明“任务目标”和“约束条件”（如“调试Python代码时，需说明代码运行环境是Python 3.9”）；
避免额外的思维链提示：推理模型默认会输出步骤，无需再要求“分步思考”，否则可能导致重复；
动态调整提示词：若首次输出有误，补充“错误点”重新提示（如“刚才的代码调试中，未考虑空列表情况，请补充处理逻辑”）；
分工协作：复杂任务可让两类模型配合——通用模型负责“数据预处理”（如提取文本关键词），推理模型负责“深度分析”（如基于关键词推导结论）。

五、实战应用：用提示词工程解决实际问题

以具体应用场景为例:

批量对员工咨询做意图分类：通过设计合适的提示词，引导大模型对员工的各类咨询内容进行意图分类，如将咨询分为 “薪资福利咨询”“考勤制度咨询”“业务流程咨询” 等类别，方便后续针对性处理。
用大模型做文档审阅：构建提示词时，明确文档审阅的标准和重点关注内容（如格式规范、内容准确性、逻辑连贯性等），让大模型对文档进行全面审阅，并指出存在的问题及修改建议。
实现针对问题的自动文档修订：在提示词中清晰说明文档中存在的问题类型（如语法错误、表述模糊、逻辑混乱等），以及修订后的预期效果，让大模型自动对文档进行修订。

以下是3个高频实战场景，结合前文技巧，完整展示提示词设计与应用过程。

场景1：员工咨询意图分类（企业客服场景）

需求

将员工的咨询文本分为“薪资问题”“考勤问题”“福利问题”三类，输出JSON格式，以便对接企业CRM系统。

提示词设计（基于模板+结构化输出技巧）

角色：你是企业客服意图识别专家，仅负责分类，不回答具体问题。
任务目标：对员工咨询文本{{员工咨询文本}}进行分类，仅可选类别：薪资问题、考勤问题、福利问题。
上下文：
- 薪资问题：涉及工资计算、发放时间、奖金/提成规则；
- 考勤问题：涉及打卡、请假、加班记录、迟到/早退处理；
- 福利问题：涉及社保、公积金、年假、体检、节日福利。

输出格式：
{
"咨询文本": "{{员工咨询文本}}",
"意图类别": "薪资问题/考勤问题/福利问题",
"分类依据": "简要说明分类理由，不超过50字"
}

样例：
当{{员工咨询文本}}为“我上个月加班3天，加班费什么时候发？”时，输出：
{
"咨询文本": "我上个月加班3天，加班费什么时候发？",
"意图类别": "薪资问题",
"分类依据": "咨询内容涉及加班费发放时间，属于薪资范畴"
}

应用效果

输入员工咨询文本“我想查询这个月的社保缴费记录，在哪里查？”，输出：

{
"咨询文本": "我想查询这个月的社保缴费记录，在哪里查？",
"意图类别": "福利问题",
"分类依据": "咨询内容涉及社保查询，属于福利相关问题"
}

场景2：文档审阅（产品需求文档场景）

需求

审阅产品需求文档，找出“功能描述不明确”的部分，并给出修改建议。

提示词设计（基于分隔符+少样本技巧）

角色：你是产品需求文档（PRD）审阅专家，擅长识别功能描述的模糊点，语言专业且具体。
任务目标：审阅以下PRD片段，找出“功能描述不明确”的部分，每个问题需给出修改建议。

<prd_content>
【智能台灯PRD片段】
1. 支持亮度调节功能；
2. 具备睡眠模式，帮助用户入睡；
3. 可连接手机APP，实现远程控制。
</prd_content>

<review_standards>
1. 不明确的定义：未说明“功能触发条件”“参数范围”“操作方式”；
2. 建议要求：具体、可落地（如“明确亮度调节的档位范围”）；
3. 输出格式：分点列出“问题点+修改建议”，每个建议不超过30字。
</review_standards>

样例：
问题点1：“支持亮度调节功能”描述不明确；
修改建议1：明确亮度调节范围（如10%-100%）及操作方式（如触摸调节）。

应用效果

输出：

问题点1：“支持亮度调节功能”描述不明确；
修改建议1：明确亮度调节范围（如10%-100%）及操作方式（如触摸调节）。
问题点2：“具备睡眠模式，帮助用户入睡”描述不明确；
修改建议2：说明睡眠模式的触发条件及具体调节方式。
问题点3：“可连接手机APP，实现远程控制”描述不明确；
修改建议3：明确连接方式及远程控制的具体功能。

场景 3：实现针对问题的自动文档修订（学术论文场景）

需求

在学术论文修订场景下，原文本阐述了人工修订的不足和大模型提示词使用要点。缩写时保留核心信息，删减重复表述，突出关键操作。

提示词设计（基于分隔符+少样本技巧）

角色：你是专业的学术论文修订专家，精通学术写作规范和逻辑架构。
任务目标：对以下论文片段进行修订，重点处理语法错误、表述模糊和逻辑不连贯问题，使内容更严谨流畅。
<论文_content>
在实验过程中，我们发现了一些问题。首先，数据的准确性有待提高，其次，实验环境的稳定性也存在一定问题。这些问题导致实验结果不理想。
</论文_content>
<修订标准>
1. 语法要求：修正时态不一致、指代不明等基础错误；
2. 表述要求：将模糊表述转化为具体数据或操作说明；
3. 逻辑要求：补充过渡语句，增强段落连贯性；
4. 输出格式：直接输出修订后的完整段落。
样例：
原内容：“实验效果不好，需要改进。”
修订后：“实验结果显示，目标达成率仅为65%，显著低于预期值80%，需从实验参数设置和操作流程两方面进行优化。”