第八章 信息检索的评价
1. 无序检索结果集合的评价
如何度量系统的效果?信息检索中最常用的两个指标是正确率和召回率。
- 正确率(Precision,简记为P): 返回的结果中相关文档所占的比例
Precision=返回结果中相关文档的数目/返回结果的数目 - 召回率(Recall,简记为R) : 返回的相关文档占所有相关文档的比例
Recall=返回结果中相关文档的数目/所有相关文档的数目
即: P = tp / (tp + fp), R = tp / (tp + fn)
还有一个融合了正确率和召回率的指标是F值,它是正确率和召回率的调和平均值。
当时,F计算公式可简化为
。
2.有序检索结果的评价方法
正确率、准确率和F值都是针对无序的文档集合进行计算。但对于搜索引擎等有序检索结果时,需要其他评价指标。
1.MAP:全称mean average precision(平均准确率