论文地址:https://arxiv.org/pdf/2403.05313.pdf
原文地址:rat-retrieval-augmented-thoughts
Github:Implementation of RAT
2024 年 3 月 14 日

介绍
让我首先从一些一般性观察开始......
在生成式人工智能应用程序中实现效率与生成响应的准确性之间存在着紧张关系。
GenApp 的效率是指应用程序响应迅速,没有任何延迟或超时。应用程序的执行路径中也不应该有太多的组件和检查。
准确性指的是生成式人工智能应用程序的输出与用户期望之间的一致性。
GenApp 架构通常通过采用多个 LLM 交互和推理过程来实现准确性。除此之外,比较不同的响应并选择最佳响应。
显然,当引入这些措施来实现高精度时,这会损害效率。
因此,需要在效率和准确性之间取得平衡。

RAT:两步法
检索增强思维(RAT)是一种简单而有效的提示策略,结合了思维链(CoT)提示和检索增强生成(RAG)来解决长期推理和生成任务。<

RAT(检索增强思维)是一种结合思维链和检索增强生成的策略,用于解决长视距任务中的上下文感知推理问题。通过LLM的两步法,首先检索信息以修正可能的缺陷,然后采用渐进式方法逐步生成响应。RAT在代码生成、数学推理等任务上优于传统方法,模拟了人类逐步推理过程,提高效率和准确性。
最低0.47元/天 解锁文章
1976

被折叠的 条评论
为什么被折叠?



