提示词工程是解锁大模型能力的核心技术——它无需修改模型参数,仅通过优化输入方式,就能让大模型更精准、高效地完成任务。无论是通用对话、专业文档生成,还是复杂推理任务,优质的提示词都能让大模型的输出质量提升50%以上。本教程将从基础框架出发,逐步讲解提示词设计技巧、推理模型适配方法,最终落地到实战应用,帮助你系统掌握提示词工程。
一、提示词工程基础:核心框架与要素
构建有效的提示词,首先需要掌握“结构化框架”——它能让大模型清晰理解任务目标、约束条件和输出要求,避免因需求模糊导致的无效输出。
1.1 提示词六要素框架(必学基础)
提示词的核心是“让大模型明确‘做什么、为什么做、怎么做’”,以下六个要素是所有优质提示词的基础,缺一不可:
| 要素(Element) | 核心含义 | 示例(以“生成产品使用手册”为例) |
|---|---|---|
| 任务目标(Object) | 明确大模型要完成的具体任务,避免模糊表述 | “生成一款智能手环的使用手册,覆盖开机设置、功能操作、常见问题3个模块” |
| 上下文(Context) | 提供任务背景信息,限定讨论范围 | “该智能手环面向中老年用户,需避开专业术语;支持心率监测、睡眠分析、久坐提醒功能” |
| 角色(Role) | 定义大模型的身份/语气,约束输出风格 | “你是专业的产品文档工程师,语言需简洁易懂,步骤清晰,符合中老年用户阅读习惯” |
| 受众(Audience) | 明确输出内容的目标用户,匹配内容深度 | “受众为50-70岁中老年用户,对智能设备操作不熟悉,需用‘一步一图’的简化表述” |
| 样例(Sample) | 提供参考案例,让大模型对齐格式/风格 | “【样例:开机设置步骤】 1. 长按侧面电源键3秒,屏幕亮起即开机; 2. 选择语言:按上下键切换至‘中文’,按确认键确认” |
| 输出格式(Output Format) | 规定输出的结构、类型,明确“不输出什么” | “输出格式要求: 1. 分3个章节,每章节配二级标题(如‘1. 开机设置’); 2. 操作步骤用数字序号,每步不超过20字; 3. 不包含技术参数(如芯片型号、电池容量)” |
1.2 辅助思维范式:让需求更精准
除了六要素,还可结合经典问题分析方法,进一步细化需求,尤其适合复杂任务(如问题诊断、方案设计):
- SWOT分析法:用于“任务风险评估”,例如“生成市场推广方案时,需先分析产品的优势(S)、劣势(W)、机会(O)、威胁(T)”;
- 5W2H分析法:用于“任务拆解”,例如“设计用户调研问卷时,需明确Who(调研对象)、What(调研内容)、When(调研时间)、Where(调研渠道)、Why(调研目的)、How(调研方式)、How much(样本量)”;
- 阿里云百炼提示词优化工具:若对提示词设计不熟悉,可使用该工具自动补全要素、优化表述(需在阿里云百炼平台调用)。

二、提示词模板:标准化应用的关键
在开发大模型应用时,直接让用户写提示词效率低、质量不稳定——提示词模板能解决这一问题:它预设固定要素(如角色、输出格式),仅保留动态参数(如用户输入的任务内容),让开发者通过“填空”快速生成标准化提示词。
2.1 模板设计原则
- 固定不变的内容预设:角色、输出格式、注意事项等通用规则提前写死;
- 动态内容用占位符标识:用
{{变量名}}表示需要用户输入的部分; - 添加约束说明:明确“不允许的输出”,避免大模型偏离方向。
2.2 实战模板示例(以“员工咨询意图分类”为例)
该模板用于企业客服场景,将用户咨询分为“薪资问题”“考勤问题”“福利问题”三类,输出结构化结果以便下游系统处理:
# 提示词模板:员工咨询意图分类
角色:你是企业客服意图识别专家,仅专注于员工咨询的分类任务,不回答具体问题。
任务目标:将员工的咨询内容{{员工咨询文本}}分为以下3类之一:
1. 薪资问题:涉及工资计算、发放时间、奖金规则的咨询;
2. 考勤问题:涉及打卡、请假、加班记录的咨询;
3. 福利问题:涉及社保、公积金、年假的咨询。
输出格式要求:
{
"咨询文本": "{{员工咨询文本}}",
"意图类别": "上述3类之一",
"分类依据": "简要说明分类理由,不超过50字"
}
注意事项:
1. 若咨询内容包含多类信息,按“主要需求”分类;
2. 不输出任何额外解释,仅返回上述JSON格式。
# 示例
当{{员工咨询文本}}为“这个月工资怎么比上个月少了200元?”时,输出:
{
"咨询文本": "这个月工资怎么比上个月少了200元?",
"意图类别": "薪资问题",
"分类依据": "咨询内容涉及工资金额差异,属于薪资计算范畴"
}
使用时,只需将{{员工咨询文本}}替换为实际内容(如“我想申请下周三的年假,需要走什么流程?”),即可快速得到标准化分类结果。
三、进阶技巧:让提示词效果翻倍
掌握基础框架后,通过以下技巧可进一步提升提示词的精准度,尤其适用于复杂任务(如代码调试、数学解题、文档审阅)。
3.1 用分隔符明确边界,避免混淆
分隔符的核心作用是“帮大模型区分‘指令’和‘待处理内容’”,避免大模型将待处理文本误判为指令。常用分隔符及场景:
| 分隔符类型 | 示例 | 适用场景 |
|---|---|---|
| 符号分隔符 | 【】 、<< >>、### | 标识关键要素(如任务目标、样例) |
| 段落分隔符 | === 、--- | 分隔不同模块(如上下文和输出格式) |
| XML标签 | <context></context> 、<sample></sample> | 结构化强的任务(如文档提取、代码生成) |
注意:若提示词中已大量使用某类符号(如产品文档中常用【】标注注意事项),需换用其他分隔符(如<< >>),避免混淆。
示例:用XML标签分隔“待审阅文档”和“审阅要求”
任务:审阅以下产品需求文档,找出“功能描述不明确”的部分。
<review_content>
【产品需求】智能水杯功能描述:
1. 支持水质检测;
2. 提醒用户喝水;
3. 连接手机APP。
</review_content>
<review_requirements>
1. 每个功能需明确“触发条件”(如“何时提醒喝水”);
2. 标注不明确的部分,用“→”补充建议;
3. 输出格式:分点列出问题及建议。
</review_requirements>
3.2 限定角色和受众,匹配输出风格
- 角色(Role):决定大模型的“专业度”和“语气”。例如:
- 生成学术论文时,角色设为“某领域研究员,熟悉APA引用格式”;
- 撰写儿童故事时,角色设为“儿童文学作家,语言简单,多使用拟声词”。
- 受众(Audience):决定输出的“深度”和“术语密度”。例如:
- 向程序员解释API时,受众设为“5年经验的后端工程师”,可使用“接口熔断”“幂等性”等术语;
- 向普通用户解释API时,受众设为“无技术背景的用户”,需用“相当于两个软件的‘沟通桥梁’”等通俗表述。
示例:角色+受众组合的提示词
角色:你是初中物理老师,教学风格生动,擅长用生活案例解释公式。
受众:初二学生,刚学完“压强”概念。
任务:用“书包背带”“钉子钉木板”两个案例,解释压强公式P=F/S,不超过300字。
3.3 强制结构化输出,适配下游系统
大模型默认输出连续文本,但开发应用时(如数据入库、对接CRM系统),常需要JSON、CSV、Markdown等结构化格式。只需在提示词中明确格式要求,大模型即可精准生成。
示例:生成CSV格式的用户反馈统计
任务:将以下用户反馈按“问题类型”统计次数,输出CSV格式。
<feedback_list>
1. APP闪退;2. 登录失败;3. APP闪退;4. 付款页面卡顿;5. 登录失败;6. 注册收不到验证码
</feedback_list>
输出格式:CSV(第一行为表头,包含“问题类型”“次数”),不输出任何额外内容。
预期输出:
问题类型,次数
APP闪退,2
登录失败,2
付款页面卡顿,1
注册收不到验证码,1
3.4 提供少样本示例(Few-shot),对齐风格
当需要大模型输出“固定风格/结构”的内容时(如品牌Slogan、周报模板),仅靠格式描述不够,需提供1-3个样例,让大模型“照葫芦画瓢”。
示例:生成手机品牌Slogan(要求:8字以内,突出“续航”)
任务:为某国产手机品牌生成Slogan,核心突出“续航强”,要求8字以内,语言简洁有力。
样例:
1. 续航无忧,全天在线;
2. 一次充电,两天够用。
请生成3个符合要求的Slogan,分点列出。
预期输出:
- 长续航,放心用;
- 充电一次,全天续航;
- 强续航,无焦虑。
3.5 给模型“思考时间”:思维链(CoT)技巧
对于复杂任务(如数学解题、逻辑推理),直接让大模型输出答案易出错——思维链(Chain of Thought) 能引导大模型“分步思考”,通过输出中间步骤,降低推理误差。
示例:用CoT解决数学题
任务:小明有5个苹果,妈妈又买了3袋苹果,每袋4个,现在小明一共有多少个苹果?
要求:先列出解题步骤,再计算结果,不跳过任何环节。
# 思考过程
步骤1:计算妈妈买的苹果总数——每袋4个,共3袋,总数=3×4=12个;
步骤2:计算小明现有的苹果总数——原有5个+妈妈买的12个=17个;
结果:小明现在一共有17个苹果。
注意:通用大模型需明确要求“输出步骤”,而推理模型(如Qwen2.5-Math、GPT-4 Turbo)默认会输出思考过程,无需额外提示。
四、推理模型vs通用模型:适配与选择
大模型分为“通用模型”和“推理模型”两类,它们的设计目标、输出特征差异显著,需针对性设计提示词。
4.1 两类模型核心差异对比
| 对比维度 | 推理模型(如Qwen2.5-Math、DeepSeek-R1) | 通用模型(如Qwen2.5-Max、GPT-3.5) |
|---|---|---|
| 设计目标 | 专注逻辑推理、多步计算、代码调试等复杂任务 | 面向对话、文本生成、知识问答等通用场景 |
| 训练数据 | 侧重数学题解、代码逻辑、科学推理数据集 | 覆盖百科、文学、日常对话等多领域数据 |
| 输出特征 | 包含完整推导步骤,逻辑链条清晰 | 输出简洁直接,侧重结果表达 |
| 响应速度 | 复杂任务响应慢(需多步计算) | 常规任务响应快(单步生成) |
| 成本 | 推理成本较高(token单价约为通用模型的1.5-2倍) | 成本较低,适合批量处理 |
4.2 模型选择指南
| 任务类型 | 推荐模型 | 理由 |
|---|---|---|
| 日常对话、文案生成、简单问答 | 通用模型 | 响应快、成本低,满足基础需求 |
| 数学解题、代码调试、法律案例分析 | 推理模型 | 需分步推理,降低错误率 |
| 模糊任务(信息少、需求不明确) | 推理模型 | 能主动补全信息,推导合理方案 |
| “大海捞针”任务(从海量文本提取关键信息) | 推理模型 | 擅长筛选、关联信息,精准定位 |
| 时间/成本敏感的批量任务(如批量分类) | 通用模型 | 效率高,成本可控 |
4.3 推理模型专属提示词技巧
推理模型虽擅长复杂任务,但仍需优化提示词以保证质量:
- 保持任务简洁,补充足够背景:避免冗余指令,重点说明“任务目标”和“约束条件”(如“调试Python代码时,需说明代码运行环境是Python 3.9”);
- 避免额外的思维链提示:推理模型默认会输出步骤,无需再要求“分步思考”,否则可能导致重复;
- 动态调整提示词:若首次输出有误,补充“错误点”重新提示(如“刚才的代码调试中,未考虑空列表情况,请补充处理逻辑”);
- 分工协作:复杂任务可让两类模型配合——通用模型负责“数据预处理”(如提取文本关键词),推理模型负责“深度分析”(如基于关键词推导结论)。
五、实战应用:用提示词工程解决实际问题
以具体应用场景为例:
- 批量对员工咨询做意图分类:通过设计合适的提示词,引导大模型对员工的各类咨询内容进行意图分类,如将咨询分为 “薪资福利咨询”“考勤制度咨询”“业务流程咨询” 等类别,方便后续针对性处理。
- 用大模型做文档审阅:构建提示词时,明确文档审阅的标准和重点关注内容(如格式规范、内容准确性、逻辑连贯性等),让大模型对文档进行全面审阅,并指出存在的问题及修改建议。
- 实现针对问题的自动文档修订:在提示词中清晰说明文档中存在的问题类型(如语法错误、表述模糊、逻辑混乱等),以及修订后的预期效果,让大模型自动对文档进行修订。
以下是3个高频实战场景,结合前文技巧,完整展示提示词设计与应用过程。
场景1:员工咨询意图分类(企业客服场景)
需求
将员工的咨询文本分为“薪资问题”“考勤问题”“福利问题”三类,输出JSON格式,以便对接企业CRM系统。
提示词设计(基于模板+结构化输出技巧)
角色:你是企业客服意图识别专家,仅负责分类,不回答具体问题。
任务目标:对员工咨询文本{{员工咨询文本}}进行分类,仅可选类别:薪资问题、考勤问题、福利问题。
上下文:
- 薪资问题:涉及工资计算、发放时间、奖金/提成规则;
- 考勤问题:涉及打卡、请假、加班记录、迟到/早退处理;
- 福利问题:涉及社保、公积金、年假、体检、节日福利。
输出格式:
{
"咨询文本": "{{员工咨询文本}}",
"意图类别": "薪资问题/考勤问题/福利问题",
"分类依据": "简要说明分类理由,不超过50字"
}
样例:
当{{员工咨询文本}}为“我上个月加班3天,加班费什么时候发?”时,输出:
{
"咨询文本": "我上个月加班3天,加班费什么时候发?",
"意图类别": "薪资问题",
"分类依据": "咨询内容涉及加班费发放时间,属于薪资范畴"
}
应用效果
输入员工咨询文本“我想查询这个月的社保缴费记录,在哪里查?”,输出:
{
"咨询文本": "我想查询这个月的社保缴费记录,在哪里查?",
"意图类别": "福利问题",
"分类依据": "咨询内容涉及社保查询,属于福利相关问题"
}
场景2:文档审阅(产品需求文档场景)
需求
审阅产品需求文档,找出“功能描述不明确”的部分,并给出修改建议。
提示词设计(基于分隔符+少样本技巧)
角色:你是产品需求文档(PRD)审阅专家,擅长识别功能描述的模糊点,语言专业且具体。
任务目标:审阅以下PRD片段,找出“功能描述不明确”的部分,每个问题需给出修改建议。
<prd_content>
【智能台灯PRD片段】
1. 支持亮度调节功能;
2. 具备睡眠模式,帮助用户入睡;
3. 可连接手机APP,实现远程控制。
</prd_content>
<review_standards>
1. 不明确的定义:未说明“功能触发条件”“参数范围”“操作方式”;
2. 建议要求:具体、可落地(如“明确亮度调节的档位范围”);
3. 输出格式:分点列出“问题点+修改建议”,每个建议不超过30字。
</review_standards>
样例:
问题点1:“支持亮度调节功能”描述不明确;
修改建议1:明确亮度调节范围(如10%-100%)及操作方式(如触摸调节)。
应用效果
输出:
问题点1:“支持亮度调节功能”描述不明确;
修改建议1:明确亮度调节范围(如10%-100%)及操作方式(如触摸调节)。
问题点2:“具备睡眠模式,帮助用户入睡”描述不明确;
修改建议2:说明睡眠模式的触发条件及具体调节方式。
问题点3:“可连接手机APP,实现远程控制”描述不明确;
修改建议3:明确连接方式及远程控制的具体功能。
场景 3:实现针对问题的自动文档修订(学术论文场景)
需求
在学术论文修订场景下,原文本阐述了人工修订的不足和大模型提示词使用要点。缩写时保留核心信息,删减重复表述,突出关键操作。
提示词设计(基于分隔符+少样本技巧)
角色:你是专业的学术论文修订专家,精通学术写作规范和逻辑架构。
任务目标:对以下论文片段进行修订,重点处理语法错误、表述模糊和逻辑不连贯问题,使内容更严谨流畅。
<论文_content>
在实验过程中,我们发现了一些问题。首先,数据的准确性有待提高,其次,实验环境的稳定性也存在一定问题。这些问题导致实验结果不理想。
</论文_content>
<修订标准>
1. 语法要求:修正时态不一致、指代不明等基础错误;
2. 表述要求:将模糊表述转化为具体数据或操作说明;
3. 逻辑要求:补充过渡语句,增强段落连贯性;
4. 输出格式:直接输出修订后的完整段落。
样例:
原内容:“实验效果不好,需要改进。”
修订后:“实验结果显示,目标达成率仅为65%,显著低于预期值80%,需从实验参数设置和操作流程两方面进行优化。”
应用效果
输出: 在实验过程中,我们发现了两类主要问题:其一,数据采集阶段,传感器的校准误差导致原始数据的准确率仅为 78%,与预期的 95% 存在显著差距;其二,实验环境中,温湿度波动范围超出标准值 ±5%,影响了设备运行的稳定性。上述问题直接导致实验结果的误差率高达 18%,显著偏离理论预测区间。
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

1018

被折叠的 条评论
为什么被折叠?



