信息检索常用的性能评价指标

最新推荐文章于 2024-01-02 01:21:23 发布

原创

最新推荐文章于 2024-01-02 01:21:23 发布 · 3.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#文档 #c #工具 #测试

本文介绍了信息检索的评价指标，包括查全率和查准率的定义及计算方式，以及如何通过F1分数综合两者。此外，还探讨了TSAP、MAP和NDCG等其他性能指标，用于衡量检索系统的精确度和排序效果。

1 查全率与查准率

传统的信息检索评价指标主要是查全率与查准率，

查全率是指返回结果中相关文档数量与系统中总的相关文档数量的比率，主要反映检索系统召回相关结果的完整性。

查准率是指返回结果中相关文档的数量与结果总数的比值，反映检索系统查询结果的准确度。

recall = num(查询结果集中相关文档)/num(系统中总的相关文档)

precision = num(查询结果中相关文档)/num(查询结果总的文档)

查全率与查准率之间是相关的，总的结果数量越多，查全的可能性就越大，查全率就越高，相反误检的数量也越多，查准率也越多。反之亦然。

一个综合查全与查准的指标：F1(recall,precision) = 2recall*precision/(recall+precision)

查全率的计算（来源于互动百科）：

衡量某一情报检索系统从特定文献集合中检出相关文献成功度的一项指标。它的数值等于 w/x，式中 w为用户鉴别检出的 m篇文献时，认为实际对口径的文献篇数，x 为特定检索系统中所包括的全部 n篇文献中实际与某一课题相关的文献篇数。这一指标最初是由J.W.佩里与A.肯特等人于1956年提出的。F.W.兰开斯特于1979年在《情报检索系统──特性