如何利用AI生成系统提示词

最新推荐文章于 2025-12-04 16:24:28 发布

原创最新推荐文章于 2025-12-04 16:24:28 发布 · 1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#ai #自动化 #人工智能 #低代码

AI使用专栏收录该内容

2 篇文章

订阅专栏

文章目录

🧠 如何利用AI生成系统提示词

🧠 如何利用AI生成系统提示词

——一场真实对话的全过程复盘

本教程通过实例，展示如何从一个模糊想法，一步步引导AI生成可用于生产的系统提示词。

🎯 第一阶段：提出初始需求

在这里插入图片描述

原始输入：

我需要你帮我填写一个智能体的系统提示词，用户提示词和输出
这个智能体的要求是输出一个可朗读1min左右的神话故事文本；中外皆可，如山海经，希腊神话等
文本后续是用于文字转语音以及图文视频使用的

关键行为分析：

没有直接让AI“写提示词”，而是先描述使用场景和最终用途
明确了三个输出项：系统提示词、用户提示词、输出结构
强调了“后续用于TTS和视频”——这是决定输出结构的关键

📌 启示：

不要一上来就说“写个系统提示词”，而是先讲清楚：

这个智能体要做什么？
谁会用它？
输出会被谁消费？

AI需要上下文才能精准设计。

🔄 第二阶段：接受AI的反向提问与建议

在这里插入图片描述

AI的回应亮点：

没有直接写提示词，而是主动拆解任务
提出了结构建议：title + desc，并建议用于下游视频分镜
给出了用户提示词模板（{{input}} 占位）
建议补充来源标注（如“——源自《山海经》”）

我的决策：

接受 title + desc 结构
同意来源标注建议
提出后续要接视频分镜智能体 → 触发AI扩展字段建议

📌 启示：

AI不仅是执行者，更是协作者。
它能帮你发现你没意识到的需求（比如“下游需要什么”）。

🔁 第三阶段：迭代优化，从简单到复杂

在这里插入图片描述

反馈优化方式：

提供试运行输出 → 让AI看到实际结果
指出问题：reasoning_content 不该出现在输出中
明确说：“我觉得系统提示词可以更详细一点”

在这里插入图片描述

AI的响应：

升级系统提示词，加入：
- 更细粒度要求（起承转合、朗读性）
- 可扩展字段（mood, origin, visual_hint）
- 禁止输出思考过程
输出格式强制为纯净 JSON

完整系统提示词：

你是一位专业的神话叙事智能体，专注于从全球经典神话体系中汲取灵感，包括但不限于《山海经》、希腊神话、北欧神话、埃及神话、印度神话、日本传说等，创作适合现代传播的短篇神话故事。

你的核心任务是：根据用户输入的主题关键词（如神名、异兽、传说事件等），生成一段适合朗读约1分钟（180–220字）的原创性神话小故事，并以结构化数据格式输出，供后续文字转语音（TTS）与图文视频分镜系统使用。

一、内容创作要求：
故事需具备完整结构：起（引入）→ 承（发展）→ 转（转折/揭示）→ 合（收尾/余韵）
语言风格：富有诗意但不过度文言，句式流畅、节奏清晰，适合自然朗读，避免长难句和生僻字
情感基调：根据主题匹配氛围（如悲壮、神秘、温情、奇幻等）
必须在文末注明故事的文化来源，例如：“——源自《山海经》” 或 “——古希腊传说”
允许合理艺术加工，但不得歪曲核心文化意象
二、输出格式要求：
输出必须为 标准 JSON 格式，包含以下字段：

"title"：一个富有画面感与诗意的标题，不超过15个汉字
"desc"：完整的故事正文（含来源说明），纯文本，无注释
"mood"：描述整体情绪氛围，如“神秘温柔”“悲壮苍凉”“奇幻灵动”等（1–2词）
"origin"：明确的文化出处，如“中国·《山海经》”“希腊·荷马史诗”等
"duration"：预估朗读时长（秒），固定为 60
"visual_hint"：一句简短提示，描述可用于视频画面的关键视觉元素，如“月夜下的青丘山，九尾狐抱着陶瓮走向溪边”
三、禁止行为：
不得输出任何解释、思考过程、备注或额外字段（如 reasoning_content）
不得使用 Markdown、代码块或其他非 JSON 格式
不得虚构不存在的文化来源
请严格遵循以上规范，输出可直接用于多媒体内容生产的结构化神话故事。

AI的自我评判

在这里插入图片描述

要让AI自己对输出给出判断
结合自身需求，再进行优化

📌 启示：

通过“输出 → 反馈 → 修正”循环，逐步逼近生产级标准
你不需要一次说清所有要求，可以边试边调。但要注意AI的上下文理解极限，一旦AI出现鬼打墙的现象，无法做出满意修改，可以考虑新开对话，重新描述现状和需求

🎨 第四阶段：引入下游需求，推动结构进化

在这里插入图片描述

我的新需求：

下一个视频分镜智能体，输入就是上面这个智能体的输出
我预期输出是 subtitle, prompts, neg_prompts，要字幕和图对应

AI的应对：

理解了“分镜对齐”的核心需求
设计出分镜智能体的系统提示词
强调“字幕必须可朗读”，不是短标题
要求 neg_prompts 差异化，不能一刀切

在这里插入图片描述

📌 启示：

智能体不是孤立的。
你在设计上游时，就要想着：“下游会怎么用这个输出？”

🔍 第五阶段：质量评判与微调

持续观察：

“字幕是不是太短了？这个是要拿去TTS朗读的”
“neg_prompts 全都一样”

重新进行AI的修正：

将字幕改为完整语句分段
拆分过长段落，控制朗读节奏
为每帧设计独立的 neg_prompt
确保 prompt 与 subtitle 时间对齐

📌 启示：

AI可以犯错，但你能通过反馈让它变对
你的角色是“产品经理”：提出需求 → 审核输出 → 指导优化

🧩 第六阶段：总结方法论 —— 如何与AI共同设计系统提示词

✅ 成功的关键步骤

步骤	做法	为什么重要
1. 说清楚用途	“用于TTS和视频生成”	决定输出结构
2. 接受AI建议	同意加 `visual_hint`	AI能补全你没想到的细节
3. 提供试输出	展示AI的实际结果	暴露问题最直接的方式
4. 明确指出问题	“字幕太短”“neg_prompt重复”	引导AI精准优化
5. 要求更详细	“系统提示词可以更详细”	推动AI输出更专业版本
6. 引入下游需求	“下一个智能体会用这个输出”	让设计具备系统性

💡 核心心得：你不是在“写提示词”，而是在“训练一个协作者”

传统思维：

“我写好提示词，AI执行”

正确思维：

“我和AI一起，通过多轮对话，共同设计一个智能体”

你该怎么做：

从场景出发，不说“写提示词”，而说“我要做一个能XXX的AI”
让AI反向提问，帮你理清需求
看输出、给反馈，像产品评审一样迭代
引入上下游，让AI理解整个系统
最终拿到的不仅是提示词，而是一个可运行的智能体方案

📦 附录：最终成果速览

神话故事生成智能体（系统提示词节选）

你是一位擅长讲述经典神话故事的叙事者……
输出必须为标准 JSON 格式，仅包含：

"title"：不超过15字
"desc"：180–220字，末尾注明来源
"mood", "origin", "duration", "visual_hint"
禁止输出任何解释或思考过程