中科大、智源等发布推理检索框架BGE-Reasoner，打破瓶颈，让RAG学会思考

最新推荐文章于 2025-12-03 19:05:38 发布

原创

最新推荐文章于 2025-12-03 19:05:38 发布 · 523 阅读

·

13

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#搜索引擎 #百度 #人工智能

人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而，要让这些智能体真正「智能」，而非仅仅是信息的搬运工，就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题，就是推理密集型信息检索（Reasoning-Intensive IR）。

它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶颈，更对大模型智能体和深度研究（DeepResearch）等应用场景的成败具有决定性意义。

正当全球研究者都在为此寻求突破之际，我们看到了一项来自中国的贡献：BGE-Reasoner。

BGE-Reasoner 由来自中国科学技术大学、智源研究院、北京邮电大学与香港理工大学等机构的联合团队研发，是一套用于推理密集型信息检索任务的创新的端到端解决方案。通过系统性的查询理解、向量检索与重排序，该方案可显著提升搜索引擎在推理密集型信息检索任务中的表现。

在权威评测基准 BRIGHT 上，BGE-Reasoner 取得 45.2 的测试得分，以显著优势刷新了该基准的最佳纪录。

作为 BGE 系列模型的又一重要里程碑，BGE-Reasoner 不仅实现了性能上的突破，更为解决推理密集型检索这一行业难题提供了一套行之有效的新范式。从技术洞察来看，本次成果的核心创新主要体现在以下三个方面：

一个可复制的框架：提出了一个由 Rewriter、Embedder 和 Reranker 组成的三阶段模块化框架，为处理复杂查询提供了清晰、高效的工程范式。
数据驱动创新：探索并证明了利用大模型合成高质量、多领域推理训练数据的可行性，巧妙地解决了该领域训练数据稀缺的核心瓶颈。
强化学习赋能：成功将强化学习应用于 Reranker 训练，让模型在面对困难样本时具备了更强的推理和泛化能力。

相关模型权重、训练代码及训练数据即将面向社区开放，进一步推动该领域的研究与应用发展。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。