Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection

文章介绍了Self-RAG,一种改进的问答系统,它通过自我决策和生成模型来提高回答质量。该系统在推理阶段灵活地决定是否使用外部知识库,并通过Critic和Generator模型协同工作进行训练。尽管有其优点,如评估和反思能力,但文中也指出存在时间成本和回答完整性的问题,期待后续优化。

背景

RAG通过外挂知识库解决事实错误,往往引入大量的上下文 token,有些时候可能不是必要的。

Self-RAG 从大模型自身的能力出发,自我决策整个过程,生成更高质量的问答。

下面是一个简单的对比图,后面有详细的解释:

推理

整个推理过程以 Segment 为基本单位,从论文后面给的例子来看这个 Segment 就是指每一句话。在拿到问题时,区别于传统的 RAG 直接进行检索,Self-RAG 的生成模型 Generator 会首先生成特殊的 token [Retrieve=Yes/No] ,这一步决定是否要通过检索来生成对应的回答,可以自适应的调整阈值来控制结果。

当 [Retrieve=Yes] 确定触发检索后,Generator 会首先对召回的文本做相关性评估,引入特殊 token [IsREL=relevant/irrelevan

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值