对于auc的计算参考
https://blog.youkuaiyun.com/qq_22238533/article/details/78666436
https://www.zhihu.com/question/39840928?from=profile_question_card
M是正样本的个数,N是负样本的个数
如何理解分子,下面是我个人的理解。、
总体原则:负样本数 = 样本总数 - 正样本数,然后构造样本总数
每次取概率不同的正样本,其排序也不一样,构造样本总数的表达方式也不一样
rank1, 样本总数为rank1
rank2 , 再加1个就是样本总数,为rank2 + 1
rank3 , 再加2个就是样本总数,为rank3 + 2
如此类推
对预测的概率值进行从大到小排序,排名第一的为rank1,此时总样本的个数也是rank1(M+N),那么负样本的个数就是样本总数-负样本数 = rank1 - M。此时排名为rank1的正样本与负样本的组合数就是负样本的个数
接下来计算rank2时负样本的个数,样