RAG 中 Rerank 模型介绍

知识库检索(Retrieval Augmented Generation, RAG) 的效果受 Rerank(重排序)模型 的质量影响极大。Rerank 模型用于对初始检索出的候选文档重新打分和排序,从而提升最终生成回答的相关性和准确性。

目前主流和效果较好的 Rerank 模型主要基于 双塔模型(Dual Encoder) + 交叉编码器(Cross Encoder) 的组合,其中 Cross Encoder 用于精排,是效果最好的类别。以下是当前一些顶尖的 Rerank 模型及技术说明:


✅ 当前表现最好的 Rerank 模型及技术对比

模型名称 架构类型 预训练基础 语言支持 优势 说明
Cohere Rerank v3 Cross Encoder 自研 多语言 准确率高,精度优于 OpenAI Embedding + rerank Cohere API 提供,效果在多项评测中优异
BGE-Reranker-largeBAAI/bge-reranker-large Cross Encoder RoBERTa/BERT 多语言(含中英文) 开源、无需调用外部API 中文表现优异,推荐用于中文知识库
OpenAI text-embeddi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

livepy

老码农,赋闲在家要吃饭

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值