Automatic Engineering of Long Prompts

828 篇文章

已下架不支持订阅

本文探讨了自动长提示工程在大型语言模型(LLM)中的有效性,特别是在解决复杂任务时。研究发现,贪婪算法和遗传算法在构建长提示中表现出色,尤其是在搜索效率方面。提出的新方法在Big Bench Hard的8项任务中平均提高了9.2%的准确率,强调了自动化提示设计的重要性。未来的研究方向包括改进LLM变异器的正确性、防止过拟合、多句子操作自动化以及减少评估成本。

本文是LLM系列文章,针对《Automatic Engineering of Long Prompts》的翻译。

摘要

在以提示形式提供的全面说明和演示的指导下,大型语言模型(LLM)在解决复杂的开放领域任务方面表现出了非凡的能力。然而,这些提示可能很长,通常包括数百行和数千个token,并且它们的设计通常需要大量的人力。最近的研究探索了短提示的自动提示工程,通常由一句或几句组成。然而,由于其巨大的搜索空间,长提示的自动设计仍然是一个具有挑战性的问题。在本文中,我们研究了贪婪算法和遗传算法在自动长提示工程中的性能。我们证明了波束搜索的简单贪婪方法在搜索效率方面优于其他方法。此外,我们还介绍了两种新技术,它们利用搜索历史来提高我们搜索算法中基于LLM的变异的有效性。我们的结果表明,所提出的自动长提示工程算法在Big Bench Hard中的八项任务上平均实现了9.2%的准确率增益,突出了自动化提示设计对充分利用LLM能力的重要性。

1 引言

2 相关工作

3 提出的方法

4 实验设置

5 结论,局限性和未来工作

我们研究了长提示的自动提示工程问题,通常包括数千个token。我们研究了标准贪婪算法和遗传算法的性能,并开发了一种具有优异性能的新型搜索算法。在训练集上只有50个评估的情况下,我们的方法在Big Bench Hard的8个任务中实现了平均9.2%的绝对准确性提高。这表明了自动长提示调优的显著潜在好处,并强调了这一新兴领域的重要性。
作为第一篇专注于整个长提示的自动工程的论文,我们确定了当前方法的几个局限性,这些

已下架不支持订阅

<think>嗯,用户这次的问题是关于文本到图像提示工程中的10种元提示类型。从用户提供的引用资料来看,ta对提示设计(Prompt Design)有较深的研究兴趣,特别是CoT(Chain-of-Thought)相关的技术细节。虽然引用中主要讨论文本领域的提示工程,但用户显然在尝试将类似概念迁移到跨模态领域。 用户可能正在从事AI生成内容(AIGC)相关工作,或是视觉艺术领域的创作者,需要系统性地掌握图像生成的提示技巧。值得注意的是,ta特别强调"元提示"这个概念——这表明ta需要的不是基础操作指南,而是更高阶的框架性知识。 在整理回答时,我需要区分几个维度:首先是提示的构建逻辑(如角色设定/约束条件),其次是优化策略(如迭代增强/多路径推理),最后是跨模态特有的视觉控制技术。其中"风格融合"和"负面提示"这类具有图像生成特色的类型应该优先展示,这正好与引用[2]提到的Complexity-based Prompting形成跨模态呼应。 考虑到用户引用资料中多次出现CoT技术,我在"多路径推理"类型中特意加入了视觉领域的CoT变体,既延续了对话脉络,又拓展了应用场景。另外为避免信息过载,每个类型都搭配了具体可操作的示例公式,比如风格融合的插值表达式——这其实暗合了引用[1]强调的"技术重要性"。 最后生成的问题设计成阶梯状:前两个问题帮助用户实践刚学到的元提示技巧,第三个问题引导ta关注提示工程的本质矛盾(控制与创意平衡),第四个则邀请ta探索新兴技术。这种结构也借鉴了引用[3]的"分析器"思维——不仅要罗列知识,还要揭示知识之间的联系。 </think>基于文本到图像(Text-to-Image)生成领域的实践与研究,以下是文本到图像提示工程中的**10种元提示(Meta-Prompt)类型**及其核心功能: --- ### 1. **角色设定型** **功能**:为AI赋予特定身份(如画家、设计师),引导其模拟专业创作视角。 **示例**:`“作为19世纪印象派画家,绘制一幅莫奈风格的睡莲池,强调光影与笔触。”` ### 2. **约束条件型** **功能**:显式限制生成范围(如禁用元素、强制构图)。 **示例**:`“未来都市天际线,需包含悬浮列车,禁止出现人物,黄金分割构图。”` ### 3. **风格融合型** **功能**:混合多种艺术风格或媒介特征。 **示例**:`“蒸汽朋克机械龙,融合浮世绘版画线条与赛博霓虹色调。”` **公式参考**: $$ \text{风格融合} = \alpha \cdot \text{风格A} + \beta \cdot \text{风格B}, \quad \alpha+\beta=1 $$ ### 4. **迭代增强型** **功能**:分阶段优化提示,逐步细化需求(类似Active Prompting[^2])。 **示例**: ``` 初稿: “森林中的水晶城堡” 增强: “哥特式水晶城堡,晨雾弥漫,藤蔓缠绕塔尖,丁达尔效应光线。” ``` ### 5. **负面提示型** **功能**:排除不想要的元素或风格(Critical for avoiding artifacts)。 **示例**:`“赛博朋克街景,霓虹灯牌密集,避免文字模糊、肢体畸形。”` ### 6. **语义解构型** **功能**:将抽象概念拆解为可视觉化的具象元素(类似CoT[^2])。 **示例**: ``` 概念: “永恒的孤独” 解构: “冰封星球上的单株古树,极光下剪影,巨大但空旷的星空。” ``` ### 7. **多路径推理型** **功能**:提供替代性描述路径应对歧义(扩展Uncertainty-Routed CoT[^2])。 **示例**: ``` 路径1: “太空歌剧风格星际舰队” 路径2: “复古科幻插画风格星际舰队” ``` ### 8. **语境锚定型** **功能**:绑定特定文化/历史参照系增强准确性。 **示例**:`“唐代长安城元宵夜市,参考《长安十二时辰》美学,灯笼阵列纵深透视。”` ### 9. **技术参数型** **功能**:直接嵌入生成模型参数指令。 **示例**:`“超详细机甲设计,8K分辨率,虚幻引擎5渲染,景深 f/2.8,--ar 16:9”` ### 10. **元优化指令型** **功能**:指导AI自我优化提示(类似Analyzer[^3])。 **示例**:`“分析当前提示的视觉混淆点,重构一个更易生成精确悬崖瀑布场景的提示。”` --- ### 关键设计原则 - **精确性**:避免歧义词汇(如“好看”),用具体术语替代(“巴洛克浮雕细节”)。 - **层级结构**:主干概念前置,细节后缀(`主体 > 环境 > 风格 > 技术参数`)。 - **动态调参**:根据输出迭代负面提示与权重参数(如`::权重`符号)。 > 提示工程本质是**人机协作的语义对齐**,需结合生成模型的内部表征偏好(如CLIP语义空间分布[^4])持续优化[^1]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值