RAG 中 Rerank 模型介绍

最新推荐文章于 2025-11-27 07:02:16 发布

原创

最新推荐文章于 2025-11-27 07:02:16 发布 · 1.8k 阅读

CC 4.0 BY-SA版权

文章标签：

知识库检索（Retrieval Augmented Generation, RAG） 的效果受 Rerank（重排序）模型 的质量影响极大。Rerank 模型用于对初始检索出的候选文档重新打分和排序，从而提升最终生成回答的相关性和准确性。

目前主流和效果较好的 Rerank 模型主要基于 双塔模型（Dual Encoder） + 交叉编码器（Cross Encoder） 的组合，其中 Cross Encoder 用于精排，是效果最好的类别。以下是当前一些顶尖的 Rerank 模型及技术说明：

模型名称	架构类型	预训练基础	语言支持	优势	说明
Cohere Rerank v3	Cross Encoder	自研	多语言	准确率高，精度优于 OpenAI Embedding + rerank	Cohere API 提供，效果在多项评测中优异
BGE-Reranker-large（BAAI/bge-reranker-large）	Cross Encoder	RoBERTa/BERT	多语言（含中英文）	开源、无需调用外部API	中文表现优异，推荐用于中文知识库
OpenAI text-embeddi