形象理解AUC计算公式
AUC是评价一个二分类器性能的主流数值指标,定义为ROC曲线下方的面积,但这个算起来比较复杂,需要统计假阳性。另一个定义更直观,随机给一个正样本和一个负样本,多大概率正样本的score更高。
换一种说法,假设正样本有MMM个,负样本有NNN个,在所有M∗NM*NM∗N个正负样本对中,有多少正样本比负样本分高。提高AUC意味着,将所有样本按score排序,正样本要尽量排在负样本前面。各大博客贴出的AUC计算公式为
AUC=∑正样本Ranki−0.5∗(M+1)∗MM∗N AUC=\frac{\sum_{正样本}{Rank_i} - 0.5 * (M+1) * M}{M*N} AUC=M∗N∑正样本Ranki