背景
RAG通过外挂知识库解决事实错误,往往引入大量的上下文 token,有些时候可能不是必要的。
Self-RAG 从大模型自身的能力出发,自我决策整个过程,生成更高质量的问答。
下面是一个简单的对比图,后面有详细的解释:

推理

整个推理过程以 Segment 为基本单位,从论文后面给的例子来看这个 Segment 就是指每一句话。在拿到问题时,区别于传统的 RAG 直接进行检索,Self-RAG 的生成模型 Generator 会首先生成特殊的 token [Retrieve=Yes/No] ,这一步决定是否要通过检索来生成对应的回答,可以自适应的调整阈值来控制结果。
当 [Retrieve=Yes] 确定触发检索后,Generator 会首先对召回的文本做相关性评估,引入特殊 token [IsREL=relevant/irrelevan

文章介绍了Self-RAG,一种改进的问答系统,它通过自我决策和生成模型来提高回答质量。该系统在推理阶段灵活地决定是否使用外部知识库,并通过Critic和Generator模型协同工作进行训练。尽管有其优点,如评估和反思能力,但文中也指出存在时间成本和回答完整性的问题,期待后续优化。
最低0.47元/天 解锁文章
1251

被折叠的 条评论
为什么被折叠?



