让大模型自己生成prompt,生成提示(prompt)存在两种不同的操作方式。第一种方式是在文本空间中进行,这种提示以离散的文本形式存在。第二种方式是将提示抽象成一个向量,在特征空间中进行操作,这种提示是抽象的、连续的。
APE
论文地址:https://arxiv.org/abs/2211.01910
候选prompt自动生成
简单来说就是给答案,让LLM去反推prompt长什么样。典型例子如下:

由于LLM大多采用decoder-only结构,所以把需要生成的内容放在最后肯定是最合理的,作者管这种生成方法叫forward generation template。这个template看起来是作者自己设计的,这个template只是一个candidate生成器,评分的时候用的是生成的candidate,和这儿的template无关。
相应的,另一种叫reverse generation template,就是把需要生成的prompt放到文章中的任意位置。
最后一种是根据task不同来制定相应的模板,比如有的task就固定是某种问答结构,这时候你需要和task align一下。
所以这样我们就完成了prompt的自动生成。这里的prompt可以生成很多次(采样),从而生成一个候选集。
评估prompt分数
生成完了候选prompt,接下来就需要想个方法评价哪个prompt比较好。
我们需要先从训练集里取一个子集(就是取一些有gt的训练数据),然后把上一步生成的

最低0.47元/天 解锁文章
494

被折叠的 条评论
为什么被折叠?



