信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure

知识点文本检索常用的评价指标:MAP、nDCG、ERR、F-score/F-measure以及附加的Precision、Recall、AveP、CG、DCG、IDCG、MRR、cascade models

而ROC曲线及其度量指标AUC主要用于分类和识别

一,MAP


Precision(P):

准确率(精确度)是指检索得到的文档中相关文档所占的比例,公式如下:

precision=|{ relevant documents}{ retrieved documents}||{ retrieved documents}|

precision@10表示检索10个文档中包含相关所占的比例,即:|{retrieved documents}| = 10。
Recall(R):

召回率是指所有相关文档中被检索到的比例,公式如下:

recall=|{ relevant documents}{ retrieved documents}||{ relevant documents}|
Average precision(AveP):

由前面可知,准确率和召回率都只能衡量检索性能的一个方面,最理想的情况肯定是准确率和召回率都比较高。当我们想提高召回率的时候,肯定会影响准确率,所以可以把准确率看做是召回率的函数,即:P=f(R),也就是随着召回率从0到1,准确率的变化情况。那么就可以对函数P=f(R)R上进行积分,可以求 P 的期望均值。公式如下:

AveP=10P(r)dr=k=1nP(k)Δ(k)=nk=1(P(k)×rel(k))number of relevant documents

其中rel(k)表示第k个文档是否相关,若相关则为1,否则为0,P(k)

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值