召回率 精确率 准确率
某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:
准确率=700/(1400+300+300)=35%
精确率=700/(700+200+100)=70%
召回率=700/1400=50%
分母不同
链接:https://zhuanlan.zhihu.com/p/146711298
混合检索
全文检索
bm25 BM25的核心思想是基于词频(TF)和逆文档频率(IDF)来,同时还引入了文档的长度信息来计算文档D和查询Q之间的相关性
https://zhuanlan.zhihu.com/p/670322092
向量检索
首先通过embedding模型,将query向量化,然后计算得出最近的数值最高的几个
knn k个最近邻
首先通过近似算法(如HNSW)快速筛选出一部分潜在的相似文档, numCandidates个
然后计算k个
https://blog.youkuaiyun.com/dreamzuora/article/details/144597411