数据的离散化

最新推荐文章于 2022-01-12 18:21:42 发布

转载最新推荐文章于 2022-01-12 18:21:42 发布 · 862 阅读

文章标签：

#ACM #离散化

算法专栏收录该内容

51 篇文章

订阅专栏

转自：点击打开链接

有些数据本身很大，自身无法作为数组的下标保存对应的属性。

如果这时只是需要这堆数据的相对属性，那么可以对其进行离散化处理！

离散化：当数据只与它们之间的相对大小有关，而与具体是多少无关时，可以进行离散化。

例如

9 1 0 5 4 与 5 2 1 4 3 的逆序对个数相同。
设有4个数：
1234567、123456789、12345678、123456
排序：123456<1234567<12345678<123456789
=> 1 < 2 < 3 < 4
那么这4个数可以表示成：2、4、3、1

使用STL算法离散化：
思路：因为要求a[i]为原序列中的第几大（或者第几小），所以可以先将a[i]的副本b[i]排序并去重，然后看a[i]在排序后的b序列中为第几个那么就是第几大（小）。
假定待离散化的序列为a[n]，b[n]是序列a[n]的一个副本，则对应以上三步为：

sort(b, b + n);
int size = unique(b, b + n) - b;//size为离散化后元素个数
for (i = 0; i<n; i++)
a[i] = lower_bound(b, b + size, a[i]) - b + 1;//k为b[i]经离散化后对应的值

对于第3步，若离散化后序列为0, 1, 2, ..., size - 1则用lower_bound，从1, 2, 3, ..., size则用upper_bound，其中lower_bound返回第1个不小于b[i]的值的指针，而upper_bound返回第1个大于b[i]的值的指针，当然在这个题中也可以用lower_bound然后再加1得到与upper_bound相同结果，两者都是针对以排好序列。使用STL离散化大大减少了代码量且结构相当清晰。