K - Scholomance Academy
题目大意传送门
题意介绍:
输入一个数 n,接下来 n 行先输入一个’ + ’ 或 ’ - ',然后输入一个正整数,设定一个阈值 θ,可以得到以下表格
>= θ | < θ | |
---|---|---|
+ | TP | FN |
- | FP | TN |
定义两个两个值
TPR(TP出现的概论) = #TP / (#TP + #FN)
FPR(FP出现的概论) = #FP / (#FP + #TN)
注:#TP的意思是n个数中符合TP数的数量
接下来题目中给了一个积分公式:AUC,针对第三个样例,给了一幅图,结合图和公式,可以看出,AUC其实是图的面积,然后让你求AUC
思考:
一开始看这道题的时候,知道 θ 是关键,觉得是二分查找 θ 但是不知道怎么查找,后来边敲边想做出来了,二分的方向没有错
如何求AUC呢,看下图
图中阴影的面积被我分割成了几个小矩形,只要求出小矩形的面积再相加就可以求出AUC,每个小矩形有两个未知量,高和宽,可以看出,高就是 TPR
高 = TPR
而宽是由两个区间确定的,这两个区间我称为 LFPR(左FPR) 和 RFPR(右FPR)
宽 = RFPR - LFPR
所以这题的思路是枚举 TPR ,找到 LFPR 和 RFPR
是否可行?
根据上面TPR公式,分子是TP的数量,分母其实是符号为 ” + “的数量,所以输入的时候就可以找到分母(命名成n1),枚举 n1 / n1, (n1 - 1) / n1, (n1 - 2) / n1, …, 1 / n1, 循环n1次,每次都用二分找到 LFPR 和 RFPR,时间复杂度是O(n1 * log(n - n1))
怎么找?
通过枚举 TPR,我们可以反推出 θ 的范围,就可以靠这个范围二分求出 LFPR 和 RFPR
其实没必要用两次二分,根据积分公式,这个图中阴影面积一定是连续的,所以从大到小枚举 TPR 的时候二分出得出的 LFPR 一定是下一个矩形的 RFPR
对于任何一组数据,TPR 和 FPR 的最大值一定是 1.0,当 θ 为 0,TPR和FPR一定为 1
当 LFPR == RFPR时,说明左右区间相等,矩形面积为 0
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 1e6 + 10;
int a[N], b[N];// a数组存 + 的数,b数组存 - 的数
int n1, n2;
double erfen(int x)
{
int l = 0, r = n2 - 1;
while(l < r)
{
int mid = (l + r) / 2;
if(b[mid] < x) l = mid + 1