C++算法——离散化

当题目中数据的范围很大,但是数据的总量不是很大。此时如果需要用数据的值来映射数组的下标
,就可以用离散化的思想先预处理一下所有的数据,使得每⼀个数据都映射成⼀个较小的值。之后再用离散化之后的数去处理问题

适用于数据范围很大,但是数据个数较少的题目。
比如: [99, 9, 9999, 999999] 离散之后就变成 [2, 1, 3, 4] 。 [2, 1, 3, 4]是按照原数组每个数字的大小顺序映射的。

[99, 9, 9999, 999999, 99, 9] 离散之后就变成 [2, 1, 3, 4, 2, 1] 。

过程:

将[99, 9, 9999, 999999, 99, 9] 排序变为[9, 9, 99, 99, 9999, 999999]

然后映射为对应的下标,就是 [2, 1, 3, 4, 2, 1] 。

1.离散化模板之一

思路:排序 + 去重 + 二分离散化之后的值
参考代码如下:
#include<iostream>
#include<algorithm>
using namespace std;
const int N=1010;

int n;
int a[N];//原始数组 

int pos;//离散化之后的个数 
int disc[N];//帮助离散化的数组 

//二分查找x在离散数组的下标 
int find(int x)
{
	int l=1,r=pos;
	while(l<r)
	{
		int mid=l+(r-l)/2;
		if(disc[mid]>=x) r=mid;
		else l=mid+1; 
	} 
	return l;
}

int main()
{
	cin>>n;
	for(int i=1;i<=n;i++)
	{
		cin>>a[i];
		disc[i]=a[i];
	} 
	
	sort(disc+1,disc+1+n); //排序 
	pos=unique(disc+1,disc+1+n)-(disc+1); //去重之后的个数 
	
	for(int i=1;i<=n;i++)
	{
		cout<<"a["<<i<<"]离散化之后为:"<<find(a[i])<<endl;
	} 
	
	return 0;
} 

1.1例题

题目描述: 给定 n 个数,离散化之后,输出每⼀个数离散化之后的值。
测试数据:
10

1999999
12
1999999
-48444
568
12
-100
-2845630
100000001
263


// 输出
7 4 7 2 6 4 3 1 8 5

2.离散化模板之二

思路:排序 + 使用哈希表去重 + 记录离散化之后的值
参考代码如下:
#include<iostream>
#include<algorithm>
#include<unordered_map> 
using namespace std;
const int N=1010;

int n;
int a[N];//原始数组 

int pos;//离散化之后的个数 
int disc[N];//帮助离散化的数组 
unordered_map<int,int> id;  //<原始的值,离散之后的值>


int main()
{
	cin>>n;
	for(int i=1;i<=n;i++)
	{
		cin>>a[i];
		disc[i]=a[i];
	} 
	
	sort(disc+1,disc+1+n); //排序 
	for(int i=1;i<=n;i++)
	{
		int x=disc[i];
		if(id.count(x)) continue; //说明id中已经存储过x这个值了
		id[x]= ++pos; 
	}
	
	for(int i=1;i<=n;i++) //使用哈希表查找会更快
	{
		cout<<"a["<<i<<"]离散化之后为:"<<id[a[i]]<<endl;
	} 
	
	return 0;
} 

3.总结

两个模板的时间复杂度都是 N*logN,时间主要花费在排序上,只是相对于二分查找,使用哈希表查找会更快一些,但总体区别不大。
还有一点,离散化其实就是⼀种 处理数据的技巧 ,模版可以不背,根据算法思想就可以实现,同时要依据具体问题具体分析。

4.习题

4.1

这道题需要利用差分数组来解决,但是看数据范围在 [-2^31,2^31],很显然是开不出这么大的差分数组的,所以就要借助离散化的思想来处理问题。

4.2

注意:这道题如果直接去离散化,是会出现bug的,因为该题属于 区间覆盖的问题,而在离散化的时候,会 把一些区间缩小,此时再去处理这个区间覆盖问题时,就可能导致原本存在的区间直接被覆盖消失了!!!
解决方案:在记录每个值和其对应的离散化之后的下标值时,把邻近的数字也记录进去,防止区间缩小导致一些区间直接被覆盖消失。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值