本文是LLM系列文章,针对《Position Engineering: Boosting Large Language Models through Positional Information Manipulation》的翻译。
摘要
大型语言模型(LLM)的性能受到所提供提示质量的显著影响。作为回应,研究人员开发了大量的提示工程策略,旨在修改提示文本以提高任务性能。本文介绍了一种称为位置工程的新技术,它为指导大型语言模型提供了一种更有效的方法。与提示工程不同,提示工程需要付出大量努力来修改提供给LLM的文本,而位置工程只涉及更改提示中的位置信息,而不修改文本本身。我们在两种广泛使用的LLM场景中评估了位置工程:检索增强生成(RAG)和上下文学习(ICL)。我们的研究结果表明,在这两种情况下,位置工程都大大改善了基线。因此,位置工程代表了一种开发大型语言模型功能的有前景的新策略。
订阅专栏 解锁全文

1618

被折叠的 条评论
为什么被折叠?



