文本分类性能评价指标

文本分类的性能评价指标主要是召回率(recall)、准确率(precision)、F1-measure,以及用于评价全局性能的宏平均(macro-average)和微平均(micro-average)。

意义与计算公式

假定:类别ci的分类结果中,正确分为该类的样本数目是a,错误划归为该类的样本数目是b,将该类错误划归为它类的样本数目是c,总共包含C类。

召回率:recall= a / (a+c),衡量的是类别的查全率。

准确率:precision= a / (a+b),衡量的是类别的查准率。

F1-measure:衡量的是查全率和查准率的综合,以及对它们的偏向程度。


宏平均:每类文档性能指标的算数平均值。


微平均:每个文档性能指标的算数评价值。


由于微平均是对每个文档性能指标的算数平均,而某个文档的recall和precision要么都是1,要么都是0,因此micro-average(r) = micro-average(p) = micro-average(F1) = correctness / total size.


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值