哈希离散化

小技巧 mark一下
给定1e5个数,每个数的取值为1~1e9,怎样把这些数方便的哈希出来;

sort(data, data + n, cmp);

data即为离散化后的数组
为什么呢?

很容易理解啦
假如现在有一个序列
data[0] = 122, data[1] = 233, data[2] = 12, data[3] = 23, data[4] = 1000
我们要把这个序列离散化,那么希望得到的结果是:
12 —>0
23 —>1
122 —> 2
233 —>3
1000 —> 4
其实这不就是排完序之后的下标吗?

### 离散化算法的实现与方法介绍 离散化是一种将连续数据或大规模数据映射到较小整数范围的技术,其目的是减少数据处理量,从而提高算法效率和简化问题求解过程[^2]。以下是离散化算法的具体实现方法及其关键步骤。 #### 1. 数据收集与存储 在离散化过程中,首先需要将所有待处理的数据存储在一个容器中,通常使用`vector<int>`或其他动态数组结构来保存原始数据[^3]。例如: ```cpp vector<int> alls; // 存储所有待离散化的值 ``` #### 2. 排序与去重 为了确保每个数据点都能被正确映射到唯一的离散值,需要对数据进行排序并去除重复项。这一步可以通过`sort`和`unique`函数完成[^4]。代码示例如下: ```cpp sort(alls.begin(), alls.end()); // 对数据进行排序 alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去除重复项 ``` #### 3. 映射与查找 离散化的核心在于将原始数据映射到一个较小的整数范围内。通常通过二分查找的方式找到每个数据点在排序后数组中的位置[^5]。以下是一个典型的二分查找实现: ```cpp int find(int x) { int l = 0, r = alls.size() - 1; while (l < r) { int mid = l + r >> 1; if (alls[mid] >= x) r = mid; else l = mid + 1; } return l; // 返回x对应的离散化值 } ``` #### 4. 应用场景 离散化技术广泛应用于各种算法问题中,特别是在涉及区间查询、线段树、树状数组等场景时。通过离散化,可以显著降低内存消耗并提高算法效率[^3]。 --- ### 示例代码:C++实现离散化 以下是一个完整的C++代码示例,展示如何实现离散化算法: ```cpp #include <iostream> #include <vector> #include <algorithm> using namespace std; // 定义二分查找函数 int find(vector<int>& alls, int x) { int l = 0, r = alls.size() - 1; while (l < r) { int mid = l + r >> 1; if (alls[mid] >= x) r = mid; else l = mid + 1; } return l; // 返回x对应的离散化值 } int main() { vector<int> nums = {10, 9, 12, 6, 97, 90}; // 原始数据 vector<int> alls = nums; // 复制原始数据用于离散化 // 排序并去重 sort(alls.begin(), alls.end()); alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 输出离散化结果 for (auto x : nums) { cout << "原始值: " << x << ", 离散化值: " << find(alls, x) << endl; } return 0; } ``` --- ### 注意事项 1. **数据范围**:离散化适用于数据范围大但实际值较少的情况。如果数据分布均匀且范围较小,则无需离散化。 2. **稳定性**:在某些情况下,可能需要保留原始数据的顺序信息,此时需注意离散化后的映射是否满足需求[^5]。 3. **性能优化**:对于非常大的数据集,可以结合哈希表或其他数据结构进一步优化查找效率。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值