ReasonIR：推理任务的首选检索器-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00663/article/details/147711251

ReasonIR：推理任务的首选检索器

ReasonIR Official repository for paper "ReasonIR Training Retrievers for Reasoning Tasks". 项目地址: https://gitcode.com/gh_mirrors/re/ReasonIR

项目介绍

ReasonIR 是一种专为通用推理任务设计的检索器，它在 BRIGHT（推理密集型检索）上达到了最先进的检索性能。当应用于检索增强生成（RAG）时，ReasonIR-8B 也能在 MMLU 和 GPQA 任务上带来显著的性能提升。该模型由 Facebook Research 开发，旨在通过深度学习技术提升信息检索在复杂推理场景下的效果。

项目技术分析

ReasonIR-8B 的核心是一个深度学习模型，该模型针对推理密集型的检索任务进行了专门的训练。它的主要特点包括：

自定义编码架构：ReasonIR 使用了独特的双向编码架构，以更好地捕捉查询和文档之间的复杂关系。
bf16 精度支持：通过设置 torch_dtype="auto"，模型能够自动激活 bf16 精度，从而在保持性能的同时降低内存消耗。

在部署模型时，需要确保使用 trust_remote_code=True 来启用自定义编码架构。此外，ReasonIR 还支持 SentenceTransformer，它允许使用 mean pooling 的普通检索模型无缝集成。

代码示例

以下是使用 ReasonIR-8B 的 Python 示例代码：

from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("reasonir/ReasonIR-8B", torch_dtype="auto", trust_remote_code=True)

query = "The quick brown fox jumps over the lazy dog."
document = "The quick brown fox jumps over the lazy dog."
query_instruction = ""
doc_instruction = ""

model = model.to("cuda")
model.eval()

query_emb = model.encode(query, instruction=query_instruction)
doc_emb = model.encode(document, instruction=doc_instruction)

sim = query_emb @ doc_emb.T