保研机试——巨大坐标系问题

第一步:识别问题特征

当你看到以下一个或多个特征时,立即意识到这是“巨大坐标系问题”:

  • 坐标范围巨大x, y 的范围达到 10910^9109 甚至 101810^{18}1018
  • 点/操作数量有限:有意义的点或查询的数量 q 在一个可接受的范围内(通常是 105∼10610^5 \sim 10^6105106)。
  • 内存限制严格:通常为 256MB 或 512MB。
  • 直接开二维数组 grid[N][N] 必将导致 MLE (内存超限)
第二步:根据需求选择方案(决策流程)

拿到题目后,问自己以下几个关键问题,以决定使用哪种工具:

  1. 我需要利用坐标的“顺序”吗?
    • 比如,是否需要查找“最近/下一个/上一个”点?是否需要按坐标排序?
    • -> 方案一:map,利用其自动排序特性。
  2. 我只关心“某个点是否存在”或“某个点上存了什么值”吗?
    • 完全不关心点与点之间的顺序和距离。
    • -> 方案二:unordered_map,追求最快的平均访问速度。
  3. 我需要处理“一个区域/范围”内的信息吗?
    • 比如,统计一个矩形内有多少个点?对一个矩形内的所有点进行修改?
    • -> 方案三:坐标压缩(离散化) + (树状)数组/线段树

方案一:map —— 处理有序关系

适用场景

  • 查找离某点最近的邻居(上下左右、对角线)。
  • 查找某个坐标的前驱/后继。
  • 需要按坐标顺序遍历所有点。
  • “飞镖”问题就是典型案例。

核心思想
map 底层是红黑树,它会根据键 (key) 自动排序。我们可以利用这个特性和二分查找函数 (lower_bound/upper_bound) 来高效地查找邻近元素。

模板代码

  1. 存储二维坐标点信息

    #include <map>
    #include <utility> // for pair
    
    // T 可以是任何类型,如 int, bool, char, struct
    map<pair<int, int>, T> points;
    
    // --- 常用操作 ---
    // 插入/更新: 在 (x,y) 放置值为 val 的标记
    points[{x, y}] = val;
    
    // 查询: 检查 (x,y) 是否有标记
    if (points.count({x, y})) {
        // 存在
        T value = points.at({x, y}); 
    }
    
    // 删除
    points.erase({x, y});
    
  2. 按行/列分组,快速查找邻居(“飞镖”问题核心技巧)

    #include <map>
    #include <vector>
    #include <algorithm>
    
    // cols[y] 存储了第 y 列所有点的 x 坐标 (自动有序)
    map<int, vector<int>> cols; 
    
    // --- 查找 (x, y) 正上方最近的点 ---
    int target_x = -1;
    if (cols.count(y)) {
        auto& x_coords = cols.at(y);
        // lower_bound 找到第一个 >= x 的元素
        auto it = lower_bound(x_coords.begin(), x_coords.end(), x);
        
        if (it != x_coords.begin()) {
            --it; // 回退一个位置,即为 < x 的最大元素
            target_x = *it;
        }
    }
    // target_x == -1 表示上方没有点
    

优缺点

  • 优点:自动排序,功能强大,能处理复杂的邻近查询。
  • 缺点:所有操作都是 O(log⁡N)O(\log N)O(logN),在海量查询下可能比哈希表慢。

方案二:unordered_map —— 最快的单点操作

适用场景

  • 只关心某个点“存/不在”,例如记录棋盘上某个点是否被访问过。
  • 统计每个坐标出现的次数。
  • 对坐标顺序完全没有要求。

核心思想
利用哈希表,实现平均 O(1)O(1)O(1) 的增、删、查。比 map 更快。

模板代码 (技巧:将二维坐标合并为 long long)

为了避免为 pair 写自定义哈希函数的麻烦,通常将二维坐标 (x, y) 转换成一个 long long 类型的数字作为键。

#include <unordered_map>

// C 是一个比所有 y 都大的常数, e.g., 1e9 + 7
const long long C = 2e9; // 假设 y < 2e9

// T 可以是任何类型
unordered_map<long long, T> points;

long long key = (long long)x * C + y;

// --- 常用操作 ---
// 插入/更新
points[key] = val;

// 查询
if (points.count(key)) {
    // 存在
    T value = points.at(key);
}

// 删除
points.erase(key);

优缺点

  • 优点:极快!平均 O(1)O(1)O(1) 的性能。
  • 缺点:无序!无法进行邻近查找。有极低概率发生哈希碰撞导致性能下降。

方案三:坐标压缩 (离散化) —— 处理范围查询

适用场景

  • 统计一个矩形区域内有多少个点。
  • 对一个矩形区域进行统一的修改/赋值。
  • 坐标的绝对值不重要,只有相对大小关系重要。

核心思想
将稀疏、巨大的坐标值(如 10,5000,10910, 5000, 10^910,5000,109)映射到连续的、紧凑的整数索引(如 0,1,20, 1, 20,1,2),然后在这些紧凑的索引上使用树状数组、线段树等高效数据结构。

模板代码

#include <vector>
#include <algorithm>

// 假设 all_coords 存储了所有用到的 x 或 y 坐标
vector<int> all_coords; 

// --- 压缩步骤 ---
// 1. 排序
sort(all_coords.begin(), all_coords.end());
// 2. 去重
all_coords.erase(unique(all_coords.begin(), all_coords.end()), all_coords.end());

// --- 获取一个原始坐标 v 对应的压缩后索引 ---
int get_compressed_index(int v) {
    // lower_bound 返回第一个不小于 v 的元素的迭代器
    // 减去 begin() 得到从0开始的索引
    return lower_bound(all_coords.begin(), all_coords.end(), v) - all_coords.begin();
}

// --- 使用示例 ---
// int original_x = 1e9;
// int compressed_x = get_compressed_index(original_x);
// 现在就可以在比如 bit[compressed_x] 上操作了

优缺点

  • 优点:能够将问题转化为可以使用数组、树状数组等数据结构的模型,功能极强。
  • 缺点:实现相对复杂,需要预处理所有坐标。只适用于离线算法(即需要知道所有查询才能开始处理)。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱看烟花的码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值