202012-2 期末预测之最佳阈值

文章介绍了如何利用差分和前缀和的技巧来解决一道编程题目,涉及对数据中0和1的计数,以及在有重复阈值时如何选择正确答案。通过对序列进行排序和计算前后0和1的数量,可以找到满足条件的预测结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

思路

看到这道题,首先让我想到了202109-2非零段划分这道题,那道题用到了差分和前缀和,因为这两道题很像,我就一度在想如果使用差分和前缀和。最开始的时候没有想到一个合适的思路,于是就查看了网上其他人的做法:统计当前这个数前0的个数和当前这个数之后1的个数(包括这个数)。
我思考了以下这个思路发现确实可行,但是提供这个思路的博主我认为他讲的不够详细,下面讲解一下我的思路。
举个例子:
0 0
1 0
1 1
1 1
1 0
2 1
3 1
在这个数据中,假如以第一个数0作为当前的数,也就是说当前的阈值就是0,那么排序后,在这个数之前的数其 实际结果等于0才能说明预测正确,同时在这个数之后的数(包括自己)其实际结果等于1才能说明预测正确。这就是为什么要统计0和1的原因了。
代码如下:

sort(zou+1,zou+n+1,cp);
    for(int i=2;i<=n;i++)//统计这个数之前(不包括当前这个数)有多少个0,
    {
        if(zou[i-1].res==0)pre[i]=pre[i-1]+1;
        else pre[i]=pre[i-1];
    }
    for(int i=n;i>=1;i--)//统计这个数之后(包括当前这个数)有多少个1
    {
        if(zou[i].res==1)af[i]=af[i+1]+1;
        else af[i]=af[i+1];
    }

但是仔细思考后会发现,如果存在多个阈值相同的数怎么办,例如上面列举的例子。
我们来思考一下,如果阈值为1,预测正确的数=阈值小于1的值中result=0的个数+阈值大于等于1的值中result=1的个数.
我们会发现符合上述要求的值只有第一个,即排序后重复出现的相同阈值的第一个才是正确的值。其余的都应该被省略。
因此完整代码如下:

#include <iostream>
using namespace std;
#include <bits/stdc++.h>
#include<algorithm>
struct node{
    int pre;
    int res;
}zou[100005];
int pre[100005];
int af[100005];
bool cp(node x,node y)
{
    return x.pre<y.pre;//升序
}
int main()
{
    int n;cin>>n;
    for(int i=1;i<=n;i++)
    {
      cin>>zou[i].pre>>zou[i].res;
    }
    sort(zou+1,zou+n+1,cp);
    for(int i=2;i<=n;i++)//统计这个数之前(不包括当前这个数)有多少个0,
    {
        if(zou[i-1].res==0)pre[i]=pre[i-1]+1;
        else pre[i]=pre[i-1];
    }
    for(int i=n;i>=1;i--)//统计这个数之后(包括当前这个数)有多少个1
    {
        if(zou[i].res==1)af[i]=af[i+1]+1;
        else af[i]=af[i+1];
    }
    int ma=0;int xia=0;int te=0;
    for(int i=1;i<=n;i++)
    {
        if(zou[i].pre==zou[i+1].pre)
        {
            i=i+2;//跳过其余的重复值。
            if(te==0)//只记录第一个
            {
                te=i;
                if(pre[te]+af[te]>=ma){ma=pre[te]+af[te];xia=zou[te].pre;}
            }
        }
        else{
            te=0;
            if(pre[i]+af[i]>=ma){ma=pre[i]+af[i];xia=zou[i].pre;}
        }
    }
    cout<<xia;
    return 0;
}

### 关于最佳阈值的前缀和算法实现 在解决“期末预测最佳阈值”的问题时,可以采用前缀和的方法来优化计算效率。通过分析输入数据中的`result`数组以及对应的`y`值,我们可以利用前缀和的思想快速统计对于任意给定阈值θ,在该阈值下的预测正确次数。 #### 数据预处理 为了便于后续操作,先将所有的样本按照其安全指数`y`升序排列[^1]。这样做的好处是可以方便地分段统计每一段内的预测结果分布情况。 #### 计算前缀和 定义两个辅助数组用于存储累计的结果: - `prefix_zero[i]`: 表示从第一个样例到第i个样例中,实际结果为0的数量。 - `suffix_one[i]`: 表示从第i个样例到最后一个样例中,实际结果为1的数量。 这两个数组可以通过一次遍历完成初始化: ```python def calculate_prefix_and_suffix(a, n): prefix_zero = [0] * (n + 1) suffix_one = [0] * (n + 1) count_zero = 0 for i in range(n): if a[i][1] == 0: # result is zero count_zero += 1 prefix_zero[i + 1] = count_zero count_one = 0 for i in range(n - 1, -1, -1): if a[i][1] == 1: # result is one count_one += 1 suffix_one[i] = count_one return prefix_zero, suffix_one ``` 上述函数实现了基于排序后的列表`a`构建所需的前缀零计数器和后缀一计数器[^3]。 #### 遍历求最大正确率 有了这些准备之后,我们就可以枚举每一个可能作为阈值的安全指数,并依据之前建立好的前缀和关系迅速得出对应条件下的总正确预测数目: ```python max_correct = 0 best_theta = None for i in range(len(a)): current_y = a[i][0] correct_before = prefix_zero[i] # Number of zeros before this y value. correct_after = suffix_one[i] # Number of ones after or at this y value. total_correct = correct_before + correct_after if total_correct > max_correct: max_correct = total_correct best_theta = current_y ``` 此部分逻辑的核心在于理解如何分割区间并有效运用已有的统计数据得到全局最优解[^2]。 #### 总结 最终返回的最佳阈值即为我们所找到的最大化预测准确度的那个特定数值。这种方法不仅提高了时间复杂度上的表现,还简化了代码结构使其更加清晰易懂。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值