RAG多路召回率的提高

最新推荐文章于 2025-04-23 19:16:31 发布

编程咩

最新推荐文章于 2025-04-23 19:16:31 发布

阅读量1.1k

点赞数 2

文章标签： python 系统架构 AI编程全文检索算法

本文链接：https://blog.youkuaiyun.com/weixin_39060924/article/details/139811126

版权

目前RAG还在快速发展，本帖总结了目前流行的五种思路。进一步讨论请留言
——————-
RAGFlow的做法：加权求和，缺点较为明显（当其中一种检索方式给出的完全不准确时，会影响到整体的结果）
DIFY的做法：同时执行全文检索和向量检索，并应用重排序步骤，从两类查询结果中选择匹配用户问题的最佳结果，需配置 Rerank 模型 API。
Elasticsearch的做法：基于向量检索和全文检索进行多路召回，然后用线性加权总和基于结果倒数的融合排序（RRF）两种方式。
百度智能千帆：在检索问答时通过知识点来索引到对应的切片，大模型根据切片内容生成答案，开启知识增强会调用大模型抽取更加丰富的知识点，增加切片的召回率。
Kimi的做法：增强模型输入的上下文大小，以减少对文档切片的次数。这样会降低匹配中目标切片的难度。

#RAG #检索增强 #搜索引擎 #算法工程师 #计算机专业