前言:由于三番五次碰到:Accuracy、Precision、Recall、F1 Score4个名词,所以花点时间作个笔记。同时,也为后来者减不必要的时间的开支,4个名词的的以下各种阐述是基于二分类。其他请勿多想。
介绍:给一群病人分类,将他们分为癌症患者与否,这是一个二分类问题。则有四种情况:真 正类(TP,预测为正类,其实也为正类)、真 负类(预测为负类,其实也为负类)、假 正类(预测为正类,其实为负类)、假 负类(预测为负类,其实为正类)。其中 “真假” 可以理解为:是否预测正确,正类与负类表示预测的结果是正类还是负类。通常情况下,有癌症定义为正类,否则反之。
Accuracy(准确率)
也即:预测正确样本数所占的比例。(正例预测为正的数量+负例预测为负的数量)
Precision(精确率)
也即:预测正确的正类数占预测出的正类总数 比例。