区间和 离散化

这篇博客介绍了如何利用离散化和前缀和解决一个区间加法和区间查询的问题。文章给出了具体的数据范围和输入输出格式,并提供了一个C++实现的示例代码。在代码中,通过离散化处理使得数据变得有序,然后使用前缀和计算区间和,以提高查询效率。此外,还解释了离散化的概念和作用。

假定有一个无限长的数轴,数轴上每个坐标上的数都是 00。

现在,我们首先进行 nn 次操作,每次操作将某一位置 xx 上的数加 cc。

接下来,进行 mm 次询问,每个询问包含两个整数 ll 和 rr,你需要求出在区间 [l,r][l,r] 之间的所有数的和。

输入格式

第一行包含两个整数 nn 和 mm。

接下来 nn 行,每行包含两个整数 xx 和 cc。

再接下来 mm 行,每行包含两个整数 ll 和 rr。

输出格式

共 mm 行,每行输出一个询问中所求的区间内数字和。

数据范围

−109≤x≤109−109≤x≤109,
1≤n,m≤1051≤n,m≤105,
−109≤l≤r≤109−109≤l≤r≤109,
−10000≤c≤10000−10000≤c≤10000

输入样例:

3 3
1 2
3 6
7 5
1 3
4 6
7 8

输出样例:

8
0
5

 

重要知识点:

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。

通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:

原数据:1,999,100000,15;处理后:1,3,4,2;

原数据:{100,200},{20,50000},{1,400};

处理后:{3,4},{2,6},{1,5};

主要思路:

在求区间和的时候,我们可以直接想到用前缀和的思想去实现,我们去查找alls中的x的下标的时

候,使用二分查找法可以大大提高时间效率,可以去找一个方法去让所有数据变得单调。同时需要

给alls进行去重操作,alls中存储的一定会存在重复使用的下标

 

#include<bits/stdc++.h>
using namespace std;

typedef pair<int,int> PII;
const int N=3e5+10;

int a[N],s[N]; //a[] 是用来存放值  s[]是用来求前缀和

vector<int>alls; //这个用来存储离散下标的
vector<PII> add,query;

int find(int x)//得到离散化后的坐标!
{
    int l=0,r=alls.size()-1;
    while(l<r)
    {
        int mid=l+r>>1;
        if(alls[mid] >= x) r=mid;
        else l=mid+1;
    }
    return r+1;//之所以要r+1 是方便之后的前缀和运算
}

int main()
{
    int n,m;
    scanf("%d %d",&n,&m);
    int x,c;
    for(int i=1;i<=n;i++)
    {
        scanf("%d %d",&x,&c);
        alls.push_back(x);
        add.push_back({x,c});
    }
    int l,r;
    for(int i=1;i<=m;i++)
    {
        scanf("%d %d",&l,&r);
        alls.push_back(l);
        alls.push_back(r);
        query.push_back({l,r});
    }
    sort(alls.begin(),alls.end());//排序
    alls.erase(unique(alls.begin(),alls.end()),alls.end());//去重
    
    //插入操作
    for(auto item : add)
    {
        int x=find(item.first);
        a[x]+=item.second;
    }
    
    //已经插入好所有数据  可以来求前缀和
    for(int i=1;i<=alls.size();i++) s[i]=s[i-1]+a[i];
    
    for(auto item : query)
    {
        int l=find(item.first); 
        int r=find(item.second);
        printf("%d\n",s[r]-s[l-1]);
    }
}

 GYX

 

### 数组区间离散化的定义 数组区间离散化是指将原本可能非常大范围内的数值映射到较小范围内的一系列整数,以便于更高效地进行计算操作。这一过程不仅能够减少内存占用,还能有效防止因数据过大而导致的数组越界等问题[^1]。 ### 实现方法概述 #### 方法一:基于排序与二分查找的方法 这种方法适用于静态数据集,在预处理阶段完成所有元素的离散化工作。具体步骤如下: - **Step 1**: 复制原数组至临时数组 `tmp` 并保留原有顺序。 - **Step 2**: 对临时数组 `tmp` 排序,去除重复项后获得唯一值序列。 - **Step 3**: 使用二分查找算法(如 C++ STL 的 `lower_bound()`),找到每一个原始数组中的元素对应的新位置索引作为其新的值。 以下是该方法的一个简单实现示例(C++): ```cpp for(int i = 1; i <= n; ++i) { tmp[i] = arr[i]; } sort(tmp + 1, tmp + n + 1); int len = unique(tmp + 1, tmp + n + 1) - (tmp + 1); // 更新原数组为离散后的版本 for(int i = 1; i <= n; ++i){ arr[i] = lower_bound(tmp + 1, tmp + len + 1, arr[i]) - tmp; } ``` 此代码片段展示了如何利用标准库函数来简化离散化的过程[^4]。 #### 方法二:使用 Pandas 库在 Python 中按类别标签方式离散化 当面对的是连续型特征时,可以通过设定边界条件将其划分为不同的等级或者分类。例如,在 Python 中可以借助 pandas 提供的功能快速实现这一点: ```python import pandas as pd data = [20, 25, 15, 30, 22, 17, 19, 24] labels = ['低', '中', '高'] bins = pd.cut(data, bins=[0, 18, 23, 100], labels=labels, right=False) print(bins.tolist()) # 输出: ['中', '中', '低', '高', '中', '低', '低', '中'] ``` 上述例子说明了怎样通过指定区间的上下限以及对应的标签名称来进行简单的离散化处理[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值