在介绍指标前必须先了解“混淆矩阵”,其各个元素的介绍如下:
True Positive(真正,TP):将正类预测为正类数
True Negative(真负,TN):将负类预测为负类数
False Positive(假正,FP):将负类预测为正类数误报 (Type I error)
False Negative(假负,FN):将正类预测为负类数→漏报 (Type II error)
Accuracy最容易理解,指所有样本中被正确分类的样本,包含所有样本类别。数学公式为:
Precision与Recall是比较常见的两个衡量分类精确度的参数。Precision是指在所有分类结果为某一类别的样本中,被正确分类
的个数所占比例,而Recall指的是在某一类别的所有样本中被正确分类的样本所占比例。他们的公式分别为:
注:区别这两者的关键是Presion是从分类后的样本角度看的,而Recall是从原始样本角度看的
F-measure(F-score)是Precision与Recall的加权和,因为P与R可能会存在相反的情况,这时F-Measure可以将两者综合,能更有效的评价分类结果,其公式为:
当为1是即为熟悉的F1参数: