UR2N: Unified Retriever and ReraNker

RootKai

已于 2025-04-07 10:22:04 修改

阅读量398

点赞数 3

分类专栏： RAG 文章标签：人工智能深度学习

于 2025-04-07 10:21:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38423732/article/details/147028331

版权

RAG 专栏收录该内容

12 篇文章

订阅专栏

一、动机

目前的检索都是使用混合检索：第一阶段使用，稀疏检索，然后第二阶段使用神经网络对检索到的前k个文档进行重新排序，使用分开的检索器和重新排序器需要维护两个独立的模型。而且，由于它是一个管道流程，系统的各个组件彼此之间没有互相学习，因此在错误传播方面会产生连锁反应。如果第一阶段的检索器没有检索到相关文档，重新排序器就无法从中恢复。

二、解决方法

将检索和重新排序统一到一个模型中，就是UR2N，基于编码解码器的模型，经过训练，编码器表示可以用于检索，解码器用于重新排序。

UR2N构建在Mono-T5重新排序器上，采用XTR风格来训练编码器

三、方法细节

1.背景知识：

XTR 是一种最先进的多向量模型：

1.查询和文档的表示：

每个查询和文档的token都是用一个d维向量表示，就是通过一个神经网络进行token编码维向量

这样查询和文档分别就是一个nxd、mxd的矩阵

2.对齐矩阵：

XTR中使用了一个大小维nxm的矩阵，来表示，查询和文档之间的每个token是否是top-k个相关的token。计算公式：

3.计算查询和文档之间的相似度得分：

计算公式如下：

4.计算损失：

在训练过程中，XTR 使用 交叉熵损失 来优化模型。交叉熵损失用于衡量预测的检索得分和实际标签之间的差异。损失函数表示为：

Mono-T5 是一个基于 T5 模型（一个强大的转换器架构）经过微调的模型：

专门用于处理文档重排序任务。在信息检索（IR）系统中，重排序任务的目的是从初步检索到的文档中，基于其与查询的相关性重新排列它们，通常使用一个评分机制。

2.方法细节

UR2N是一个结合了检索（retrieval）和重排序（reranking）任务的模型。在这个模型中，Mono-T5用作重排序器，而XTR则用来增强检索能力。

模型的设计：

模型架构图：

只微调新增的XTR层，其他的编码层保持冻结

XTR层的表示：

为了减少存储空间，添加了一个线性层，把XTR生成的编码器，嵌入向量压缩到更低的维度（128），表示如下：

博客等级

码龄8年

50
原创

795
点赞

701
收藏

363
粉丝

关注

私信

热门文章

分类专栏

开搞 4篇
filter 3篇
RAG 12篇
个人笔记 1篇
深度学习库 1篇
开发技巧 2篇
论文精度论文 3篇
人工智能 5篇
智能体研读 2篇
前端 2篇
二进制 4篇

最新评论

Pytorch的基本操作
qq_52464622: 哥哥真棒
Pytorch的基本操作
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
HTML基础（其他细节待边用变补充）
优快云-Ada助手: 恭喜用户写了第5篇博客！看到你在探讨HTML基础的文章，觉得非常有意思。希望你能继续保持创作的热情，探索更多关于HTML的细节，让读者能够更全面地了解这个主题。在未来的创作中，或许可以考虑加入一些实际案例或者常见问题的解决方案，让读者能够更好地应用所学知识。期待你的下一篇作品，加油！
三、有符号数的二进制表示
weixin_dhwdhw: 对于有符号的补码来说，就1000000来说，可以这么理解： -1*2^7+0*2^6+0*2^5 .....0*2^0
一、进制概念
我爱人工智能: 写的不错!期待大佬回访！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。