离散化(整数离散化)
处理的问题: 数值很大, 个数很小 (例如, 一堆数的范围为 [ − 1 0 9 , 1 0 9 ] [-10^{9} , 10^{9}] [−109,109], 共 1 0 5 10^{5} 105 个数
核心思路
将这些离散的数映射成一个下标从0开始的连续的自然数
例如: a[5] = {1, 3, 100, 2000, 1e5}可以离散化为他的下标, 即0,1,2,3,4
注意点:
a[i]中可能包含相同的元素, 所以需要去重
vector<int> alls;
sort(alls.begin(), alls.end());
alls.erase(unique(alls.begin(), alls.end()), alls.end());
- 如何需要快速的算出
a[i]离散化以后的数 -> 二分
int find(int x) {
int l = 0, r = alls.size() - 1;
while (l < r) {
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return l + 1;
}
例题
假定有一个无限长的数轴,数轴上每个坐标上的数都是 0 0 0。
现在,我们首先进行 n n n 次操作,每次操作将某一位置 x x x 上的数加 c c c。
接下来,进行 m m m 次询问,每个询问包含两个整数 l l l 和 r r r,你需要求出在区间 [ l , r ] [l,r] [l,r] 之间的所有数的和。
输入格式
第一行包含两个整数
n
n
n 和
m
m
m。
接下来 n n n 行,每行包含两个整数 x x x 和 c c c。
再接下来 m m m 行,每行包含两个整数 l l l 和 r r r。
输出格式
共
m
m
m 行,每行输出一个询问中所求的区间内数字和。
数据范围
−
1
0
9
≤
x
≤
1
0
9
,
−10^{9}≤x≤10^{9},
−109≤x≤109,
1
≤
n
,
m
≤
1
0
5
,
1≤n,m≤10^{5},
1≤n,m≤105,
−
1
0
9
≤
l
≤
r
≤
1
0
9
,
−10^{9}≤l≤r≤10^{9},
−109≤l≤r≤109,
−
10000
≤
c
≤
10000
−10000≤c≤10000
−10000≤c≤10000
输入样例:
3 3
1 2
3 6
7 5
1 3
4 6
7 8
输出样例:
8
0
5
c++ 代码
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;
typedef pair<int, int> PII;
const int N = 300010;
int n, m;
int a[N];
int s[N];
vector<int> alls;
vector<PII> add, query;
int find(int x) {
int l = 0, r = alls.size() - 1;
while (l < r) {
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return l + 1;
}
int main() {
cin >> n >> m;
for (int i = 0; i < n; i++) {
int x, c;
cin >> x >> c;
add.push_back({x, c});
alls.push_back(x);
}
for (int i = 0; i < m ;i++) {
int l, r;
cin >> l >> r;
query.push_back({l, r});
alls.push_back(l);
alls.push_back(r);
}
// 离散化 + 去重
sort(alls.begin(), alls.end());
alls.erase(unique(alls.begin(), alls.end()), alls.end());
for (auto item : add) {
int x = find(item.first);
a[x] += item.second;
}
for (int i = 1; i <= alls.size(); i++) s[i] = s[i - 1] + a[i];
// 处理询问
for (auto item : query) {
int l = find(item.first), r = find(item.second);
cout << s[r] - s[l - 1] << endl;
}
return 0;
}
该博客介绍了如何使用离散化技术处理大范围数值的问题,特别是针对一个包含大量不同数值但数量有限的集合。通过排序、去重,将数值映射为连续的下标,然后利用二分查找实现高效计算。文章以区间和的计算为例,展示了在处理区间求和查询时,离散化和前缀和如何结合以提高效率。输入和输出格式、数据范围以及C++代码实现均被详细阐述,旨在帮助读者理解并应用这种方法。
743

被折叠的 条评论
为什么被折叠?



