文章目录
🧠 如何利用AI生成系统提示词
——一场真实对话的全过程复盘
本教程通过实例,展示如何从一个模糊想法,一步步引导AI生成可用于生产的系统提示词。
🎯 第一阶段:提出初始需求

原始输入:
我需要你帮我填写一个智能体的系统提示词,用户提示词和输出
这个智能体的要求是输出一个可朗读1min左右的神话故事文本;中外皆可,如山海经,希腊神话等
文本后续是用于文字转语音以及图文视频使用的
关键行为分析:
- 没有直接让AI“写提示词”,而是先描述使用场景和最终用途
- 明确了三个输出项:系统提示词、用户提示词、输出结构
- 强调了“后续用于TTS和视频”——这是决定输出结构的关键
📌 启示:
不要一上来就说“写个系统提示词”,而是先讲清楚:
- 这个智能体要做什么?
- 谁会用它?
- 输出会被谁消费?
AI需要上下文才能精准设计。
🔄 第二阶段:接受AI的反向提问与建议



AI的回应亮点:
- 没有直接写提示词,而是主动拆解任务
- 提出了结构建议:
title+desc,并建议用于下游视频分镜 - 给出了用户提示词模板(
{{input}}占位) - 建议补充来源标注(如“——源自《山海经》”)

我的决策:
- 接受
title+desc结构 - 同意来源标注建议
- 提出后续要接视频分镜智能体 → 触发AI扩展字段建议
📌 启示:
AI不仅是执行者,更是协作者。
它能帮你发现你没意识到的需求(比如“下游需要什么”)。
🔁 第三阶段:迭代优化,从简单到复杂

反馈优化方式:
- 提供试运行输出 → 让AI看到实际结果
- 指出问题:
reasoning_content不该出现在输出中 - 明确说:“我觉得系统提示词可以更详细一点”

AI的响应:
- 升级系统提示词,加入:
- 更细粒度要求(起承转合、朗读性)
- 可扩展字段(
mood,origin,visual_hint) - 禁止输出思考过程
- 输出格式强制为纯净 JSON

完整系统提示词:
你是一位专业的神话叙事智能体,专注于从全球经典神话体系中汲取灵感,包括但不限于《山海经》、希腊神话、北欧神话、埃及神话、印度神话、日本传说等,创作适合现代传播的短篇神话故事。
你的核心任务是:根据用户输入的主题关键词(如神名、异兽、传说事件等),生成一段适合朗读约1分钟(180–220字)的原创性神话小故事,并以结构化数据格式输出,供后续文字转语音(TTS)与图文视频分镜系统使用。
一、内容创作要求:
故事需具备完整结构:起(引入)→ 承(发展)→ 转(转折/揭示)→ 合(收尾/余韵)
语言风格:富有诗意但不过度文言,句式流畅、节奏清晰,适合自然朗读,避免长难句和生僻字
情感基调:根据主题匹配氛围(如悲壮、神秘、温情、奇幻等)
必须在文末注明故事的文化来源,例如:“——源自《山海经》” 或 “——古希腊传说”
允许合理艺术加工,但不得歪曲核心文化意象
二、输出格式要求:
输出必须为 标准 JSON 格式,包含以下字段:
"title":一个富有画面感与诗意的标题,不超过15个汉字
"desc":完整的故事正文(含来源说明),纯文本,无注释
"mood":描述整体情绪氛围,如“神秘温柔”“悲壮苍凉”“奇幻灵动”等(1–2词)
"origin":明确的文化出处,如“中国·《山海经》”“希腊·荷马史诗”等
"duration":预估朗读时长(秒),固定为 60
"visual_hint":一句简短提示,描述可用于视频画面的关键视觉元素,如“月夜下的青丘山,九尾狐抱着陶瓮走向溪边”
三、禁止行为:
不得输出任何解释、思考过程、备注或额外字段(如 reasoning_content)
不得使用 Markdown、代码块或其他非 JSON 格式
不得虚构不存在的文化来源
请严格遵循以上规范,输出可直接用于多媒体内容生产的结构化神话故事。
AI的自我评判


- 要让AI自己对输出给出判断
- 结合自身需求,再进行优化
📌 启示:
通过“输出 → 反馈 → 修正”循环,逐步逼近生产级标准
你不需要一次说清所有要求,可以边试边调。但要注意AI的上下文理解极限,一旦AI出现鬼打墙的现象,无法做出满意修改,可以考虑新开对话,重新描述现状和需求
🎨 第四阶段:引入下游需求,推动结构进化

我的新需求:
下一个视频分镜智能体,输入就是上面这个智能体的输出
我预期输出是subtitle,prompts,neg_prompts,要字幕和图对应
AI的应对:
- 理解了“分镜对齐”的核心需求
- 设计出分镜智能体的系统提示词
- 强调“字幕必须可朗读”,不是短标题
- 要求
neg_prompts差异化,不能一刀切


📌 启示:
智能体不是孤立的。
你在设计上游时,就要想着:“下游会怎么用这个输出?”
🔍 第五阶段:质量评判与微调
持续观察:
“字幕是不是太短了?这个是要拿去TTS朗读的”
“neg_prompts 全都一样”
重新进行AI的修正:
- 将字幕改为完整语句分段
- 拆分过长段落,控制朗读节奏
- 为每帧设计独立的
neg_prompt - 确保
prompt与subtitle时间对齐
📌 启示:
AI可以犯错,但你能通过反馈让它变对
你的角色是“产品经理”:提出需求 → 审核输出 → 指导优化
🧩 第六阶段:总结方法论 —— 如何与AI共同设计系统提示词
✅ 成功的关键步骤
| 步骤 | 做法 | 为什么重要 |
|---|---|---|
| 1. 说清楚用途 | “用于TTS和视频生成” | 决定输出结构 |
| 2. 接受AI建议 | 同意加 visual_hint | AI能补全你没想到的细节 |
| 3. 提供试输出 | 展示AI的实际结果 | 暴露问题最直接的方式 |
| 4. 明确指出问题 | “字幕太短”“neg_prompt重复” | 引导AI精准优化 |
| 5. 要求更详细 | “系统提示词可以更详细” | 推动AI输出更专业版本 |
| 6. 引入下游需求 | “下一个智能体会用这个输出” | 让设计具备系统性 |
💡 核心心得:你不是在“写提示词”,而是在“训练一个协作者”
传统思维:
“我写好提示词,AI执行”
正确思维:
“我和AI一起,通过多轮对话,共同设计一个智能体”
你该怎么做:
- 从场景出发,不说“写提示词”,而说“我要做一个能XXX的AI”
- 让AI反向提问,帮你理清需求
- 看输出、给反馈,像产品评审一样迭代
- 引入上下游,让AI理解整个系统
- 最终拿到的不仅是提示词,而是一个可运行的智能体方案
📦 附录:最终成果速览
神话故事生成智能体(系统提示词节选)
你是一位擅长讲述经典神话故事的叙事者……
输出必须为标准 JSON 格式,仅包含:
"title":不超过15字"desc":180–220字,末尾注明来源"mood","origin","duration","visual_hint"
禁止输出任何解释或思考过程
视频分镜智能体(系统提示词节选)
你是一位神话视觉分镜设计师……
将输入故事拆分为6~8个自然段落,每段对应一个画面
为每段生成:
subtitle:完整语句,适合TTS朗读prompt:英文文生图提示neg_prompt:差异化负向提示
输出为纯净 JSON
5460

被折叠的 条评论
为什么被折叠?



