【Note】The Power of Grids

原创已于 2022-02-23 22:34:27 修改 · 770 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

于 2022-02-22 01:08:20 首次发布

Reference: Geometric Approximation Algorithms, Sariel Har-Peled.

回来写点看书的note，主要是简单整理一下看过的内容。看的第一本书是导师推荐的 Geometric Approximation Algorithms，里面介绍了一些几何问题的经典的techniques.

网格化（Grid）利用网格坐标点离散的性质，可以设计一些运行时间为 $poly(m)\mathrm{poly}(m)$ （ $m$ 为网格尺寸，一般不大于输入规模，如点数）的算法（多用于随机算法、近似算法）。主要讨论了两个例子：最近点对，以及最小闭包球。

一些记号

首先给出一些会用到的记号。

固定 $r∈R+r\in \mathbb R_+$ ，对于一个点 $p=(x,y)∈R2p=(x,y)\in \mathbb R^2$ ，定义 $Gr(p)=(⌊x/r⌋r,⌊y/r⌋r)G_r(p)=(\lfloor x/r \rfloor r,\lfloor y/r \rfloor r)$ 。即 $G_r$ 是一个网格，每个格子的宽度为 $r$ ， $G_r(p)$ 将点 $p$ 映射到一个交叉点处，从而变成离散的数据。定义一个网格群(grid cluster) 为连续的 $3×33\times 3$ 的区域。对于每个格子 $C\mathcal C$ ，它有一个唯一的编号 $idC=id(p)=(⌊x/r⌋r,⌊y/r⌋r)id_\mathcal C=id(p)=(\lfloor x/r \rfloor r,\lfloor y/r \rfloor r)$ ，其中 $p = (x, y)$ 是 $C\mathcal C$ 中的任意一点。对于一个点集 $P$ ，定义 $Gr(P)={Gr(p):p∈P}G_r(P)=\{G_r(p):p\in P\}$ ，即将所有 $P$ 中的点映射网格上得到的离散点集。

最近点对

求 $CP(P)=min⁡p,q∈P∥p−q∥CP(P)=\min_{p,q\in P}\|p-q\|$ 。即，给出点集 $P={(xi,yi)}i=1n⊆R2P=\{(x_i,y_i)\}_{i=1}^n\subseteq \mathbb R^2$ ，求距离（以 $L2\mathcal{L}_2$ 距离为例）最近的两个点。

首先我们有

引理1.2.2: 给定一个 $n$ 个点的点集 $P$ ，以及 $r > 0$ , 可以在线性时间内判断 $C P (P) < r$ 是否成立。

proof: 首先 $G_r(P)$ 可以在线性时间内计算得到，并且至多 $n$ 个格子内有点。只需证明：如果一个格子内有超过 $9$ 个点，则这个格子中必然存在一对点，它们的距离小于 $r$ 。考虑一个格子包含超过 $9$ 个点，把这个格子均匀分成 $3×33\times 3$ 个小格子，则必有一个小格子中有至少两个点，由于这个小格子的对角线长度为 $r2+r2/3<r\sqrt{r^2+r^2}/3<r$ ，因此必然存在一对点距离小于 $r$ 。 $■\blacksquare$

根据引理1.2.2，可以得出一个暴力做法，首先按照某种顺序排列 $P$ 中的点。假如我们已经计算出前 $i$ 个点的最近点距离，设为 $r_i$ ，以及 $G_{r_i}(P_{1,i})$ （ $P_{1,i}$ 为 $P$ 的前 $i$ 个点）。则此时 $G_{r_i}$ 中每个格子中的点的数量不超过 $9$ 个，因此把第 $i + 1$ 个点 $p_{i+1}$ 加入网格，并且计算其与以 $G_{r_i}(p_{i+1})$ 为中心的 $3×33\times 3$ 个格子中的点的距离，若最小的距离不小于 $r_i$ ，则 $r_{i+1}=r_i$ ，否则 $r_{i+1}$ 为这个最小距离。如果发现 $ri≠ri+1r_i\neq r_{i+1}$ ，则暴力重构 $G_{r_{i+1}}(P_{1,i+1})$ .

每次暴力重构需要 $O (n)$ 时间，假设重构了 $k$ 次，则总时间复杂度为 $O (n k)$ . 实际上，如果我们在开头对 $P$ 进行随机排列，则可以得到一个更好的结果

定理 1.2.3: 给定一个 $n$ 个点的点集 $P$ ，可以在期望O(n) 的时间内计算最近点对距离。

proof: 只需要对 $P$ 进行随机排列，再运行引理1.2.2 的算法即可。下分析时间复杂度：只需要分析构造网格需要的时间总和（设为 $T (n)$ ）即可。令 $X_i$ 为一个 $0 / 1$ 随机变量，若 $ri≠ri−1r_i\neq r_{i-1}$ 则 $X_i=1$ ，否则 $X_i=0$ . 则
$E[T(n)]=E\left[1+\sum_{i=2}^niX_i\right]=1+\sum_{i=2}^niE[X_i]=1+\sum_{i=2}^ni\Pr[X_i=1]$
考虑计算 $Pr[X_i=1]=\Pr[r_i<r_{i-1}]$ ，考虑排列中的前 $i$ 个点，当 $r_i<r_{i-1}$ 发生时，则 $ri−1=CP(Pi∖{pi})>CP(Pi)=rir_{i-1}=CP(P_i\setminus\{p_i\})>CP(P_i)=r_{i}$ ，我们称满足 $CP(Pi∖{p})>CP(Pi)CP(P_i\setminus\{p\})>CP(P_i)$ 的点 $p$ 为关键点，则 $p_i$ 是关键点，且显然有至多两个点是关键点。因此 $Pr[X_i=1]=\Pr[p_i$ 是关键点 $]≤2/i]\le {2/i}$ ，从而 $E [T (n)] = O (n)$ . $■\blacksquare$

$k$ -最小闭包圆（ $k$ -Enclosing Minimum Disk）的 2-近似算法

首先给出问题定义。

对于一个圆 $D$ ，其半径记为 $radius(D)\mathrm{radius}(D)$ . 定义 $D_{opt}(P,k)$ 为包含 $P$ 中 $k$ 个点的半径最小的圆，记 $r_{opt}(P,k)$ 为其半径。则要求出 $r_{opt}(P,k)$ 。

利用网格，我们可以得到以下结果

引理1.3.1:给定 $n$ 个点的点集 $P$ ，可以在 $O(n(n/k)^2)$ 的时间内得到一个圆 $D$ ，使得 $radius(D)≤2ropt(P,k)\mathrm{radius}(D)\le 2r_{opt}(P,k)$ .

proof: 在平面上求出 $m = O (n / k)$ 条水平直线，使得两两直线之间至多有 $k / 4$ 个点。这可以利用分治在 $O(nlog⁡(n/k))O(n\log (n/k))$ 时间内计算出来。同样也可以求出 $m$ 条竖直直线满足这样的要求。从而通过这些直线，我们得到了一个格子尺寸不一致（non-uniform）的网格 $G$ . 记 $X$ 为 $G$ 的所有交叉点。则有 $D_{opt}(P,k)$ 必然包含 $X$ 中的一个点。这个结论反证一下就可以得到。因此只要枚举 $X$ 中的每一个点，计算以它为圆点的 $k$ -最小闭包圆即可，这一步可以通过计算出所有点到这个点的距离后利用 kth-element 在 $O (n)$ 时间内得到。因此总的时间复杂度为 $O(n(n/k)^2)$ 。下证这是一个2-近似解。设 $D_{opt}(P,k)$ 的圆心为 $p$ ，它包含点 $x∈Xx\in X$ . 则以 $x$ 为圆心， $2r_{opt}(P,k)$ 为半径的点必然包含圆 $D_{opt}(P,k)$ ，因此至少包含 $k$ 个点，从而利用以上算法的出的 $D$ 的半径必然小于 $2r_{opt}$ . $■\blacksquare$