多阶段重排序架构:提升文本排序效率与效果的有效方案
在文本排序领域,为了更好地平衡排序效果和效率,多阶段重排序架构应运而生。本文将详细介绍多阶段重排序架构的相关内容,包括高效变压器变体的效果比较、从单阶段到多阶段重排序的转变,以及基于变压器模型的多阶段重排序架构等。
1. 高效变压器变体的效果比较
在MS MARCO文档排名任务的开发集和TREC 2019深度学习赛道文档排名测试集上,对几种高效变压器变体的效果进行了评估,具体结果如下表所示:
| Method | MS MARCO Doc (Dev) MRR@10 | MS MARCO Doc (Dev) nDCG@10 | TREC 2019 DL Doc MAP |
| — | — | — | — |
| Birch (BM25 + RM3) | – | 0.640 | 0.328 |
| Sparse - Transformer | 0.328 | 0.634 | 0.257 |
| Longformer - QA | 0.326 | 0.627 | 0.255 |
| QDS - Transformer | 0.360 | 0.667 | 0.278 |
从实验结果可以看出,Sparse - Transformer和Longformer - QA模型的性能相似,这表明Longformer - QA使用的全局令牌方法相比Sparse - Transformer的局部窗口方法并没有明显改进。而QDS - Transformer的性能优于前两者,这说明将查询令牌视为全局注意力令牌是很重要的。不过,由于缺乏足够的共同参考点,目前尚不清楚QDS - Transformer
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



