知识库检索(Retrieval Augmented Generation, RAG) 的效果受 Rerank(重排序)模型 的质量影响极大。Rerank 模型用于对初始检索出的候选文档重新打分和排序,从而提升最终生成回答的相关性和准确性。
目前主流和效果较好的 Rerank 模型主要基于 双塔模型(Dual Encoder) + 交叉编码器(Cross Encoder) 的组合,其中 Cross Encoder 用于精排,是效果最好的类别。以下是当前一些顶尖的 Rerank 模型及技术说明:
✅ 当前表现最好的 Rerank 模型及技术对比
| 模型名称 | 架构类型 | 预训练基础 | 语言支持 | 优势 | 说明 |
|---|---|---|---|---|---|
| Cohere Rerank v3 | Cross Encoder | 自研 | 多语言 | 准确率高,精度优于 OpenAI Embedding + rerank | Cohere API 提供,效果在多项评测中优异 |
| BGE-Reranker-large(BAAI/bge-reranker-large) | Cross Encoder | RoBERTa/BERT | 多语言(含中英文) | 开源、无需调用外部API | 中文表现优异,推荐用于中文知识库 |
| OpenAI text-embeddi |

最低0.47元/天 解锁文章

2521

被折叠的 条评论
为什么被折叠?



