高级算法笔记2-优快云博客

Scheduling on Parallel Machines

给定任务集合 $J={J1,J2,…,J∣J∣}\mathscr{J} = \{J_1,J_2,\dots,J_{|\mathscr{J}|}\}$ ，机器集合 $M={M1,M2,…,M∣M∣}\mathscr{M} = \{M_1,M_2,\dots,M_{|\mathscr{M}|}\}$ ， $J_j$ 分配给 $M_i$ 的处理时间为 $p_{ij}$ ，设 $x_{ij} = \{0,1\}$ 表示 $J_j$ 是否分配给 $M_i$ ，容易建出线性规划模型：

$\begin{aligned} \text{minimize}\hspace{0.5em}t &\\ \text{subject to}\hspace{0.5em}\sum\limits_{M_i \in \mathscr{M}}x_{ij} &= 1 & \forall J_j\in \mathscr{J}\\ \sum\limits_{J_j \in \mathscr{J}}x_{ij}p_{ij} &\le t & \forall M_i \in\mathscr{M}\\ x_{ij} &\in \{0,1\} & \forall M_i\in \mathscr{M}, J_j\in\mathscr{J}\\ \end{aligned}$

将 $J_j$ 分配给 $p_{ij}$ 最小的 $M_i$ ，得到一个可行答案 $τ\tau$ ，二分答案 $\in \left[\dfrac{\tau}{|\mathscr{M}|}, \tau\right]$ ，设 $ST={(i,j):Mi∈M,Jj∈J,pij≤T}S_T = \{(i,j) : M_i \in \mathscr{M}, J_j\in \mathscr{J}, p_{ij}\le T\}$ ，我们只需判定以下约束是否存在可行解：

$\begin{aligned} \sum\limits_{(i,j)\in S_T}x_{ij} &= 1 & \forall J_j \in \mathscr{J} \\ \sum\limits_{(i,j)\in S_T}x_{ij}p_{ij} &\le T &\forall M_i \in \mathscr{M} \\ x_{ij} &\in \{0, 1\} & \forall (i,j) \in S_T \\ \end{aligned}$

现将 $xij∈{0,1}x_{ij} \in \{0, 1\}$ 放宽限制至 $xij≥0x_{ij} \ge 0$ ，通过单纯形算法求出一组解 $L P (T)$ ，我们将通过合适的调整得到一组较好的近似解。
Lemma 1 $L P (T)$ 中至多有 $∣J∣+∣M∣|\mathscr{J}| + \mathscr{|M|}$ 个不为 0 的变量。

证明由于总共有 $S_T|$ 个变量，需恰有 $S_T|$ 个相互独立的不等式取等号，而允许 $x_{ij}$ 不为 0 的不等式只有 $∣J∣+∣M∣|\mathscr{J}| + |\mathscr{M}|$ 个，所以 $x_{ij}$ 为 0 的变量至少有 $∣ST∣−(∣J∣+∣M∣)|S_T| - (|\mathscr{J}| + |\mathscr{M}|)$ 个，原命题得证。

Lemma 2 $L P (T)$ 至少有 $∣J∣−∣M∣|\mathscr{J}| - \mathscr{|M|}$ 个为 1 的变量。

证明假设 $J\mathscr{J}$ 中有 $α\alpha$ 个只分给一台 $M_i$ 的 $J_j$ 和 $β\beta$ 个不止分给一台 $M_i$ 的 $J_j$ ，由 Lemma 1
$\begin{cases} \alpha + \beta = |\mathscr{J}| \\ \alpha + 2\beta \le |\mathscr{J}| + |\mathscr{M}| \\ \end{cases} \Rightarrow \begin{cases} \alpha \ge |\mathscr{J}| - |\mathscr{M}|\\ \beta \le |\mathscr{M}| \\ \end{cases}$

显然 $L P (T)$ 中 $\le x_{ij} \le 1$ ，我们将 $x_{ij}$ 中为 0 和为 1 的变量保留，构建二分图 $<\mathscr{J} \cup \mathscr{M},E>$ ，若 $x_{ij} > 0$ ，将 $M_i$ 向 $J_j$ 连边。记 $\{J_j | \exists(i,j)\in S_T, 0 < x_{ij} < 1\}$ 。
Lemma 3 $G$ 中每个连通块要么是树，要么是基环树（pseudo-tree，either a tree or a tree plus a single edge，类似的有基环树森林的概念，pseudo-forest)。

证明可以把 $G$ 中每个连通块看作是原问题的一个子问题，也对应一个同类型的线性规划，全局最优解一定是子问题的最优解，故可以对每个连通块应用 Lemma 1，即每个连通块内的边数不会超过点数。

对于任意 $v∈J/Fv\in \mathscr J / F$ ，删去该点及其唯一的连边，剩下的图依然满足 Lemma 1，且叶子结点均属于 $M\mathscr M$ 。对于树，可以从叶子结点开始不断往上贪心取匹配；对于基环树，贪心匹配去除环外的树，剩下的一定是一个偶环。即总一定存在一个关于 $F$ 的完美匹配。
将完美匹配对应的 $x_{ij}$ 设为 1，由匹配的定义以及 $pij≤Tp_{ij} \le T$ ，调整后得到的解至多扩大到原来解的两倍，故我们得到了 $α=2\alpha = 2$ 的近似算法。
构造以下例子可使 $α\alpha$ 无限接近取到 2：
- $m$ 台机器， $m (m - 1) + 1$ 个任务，其中一个任务 $J_1$ 处理时间为 $m$ ，其余为 1。
- 线性规划找到的解可能是 $xi1=1mx_{i1} = \dfrac{1}{m}$ ，其余 $j$ 恰有一个 $x_{ij} = 1$ 。
- 这时候调整得到的解就为 $2 m - 1$ ，实际最优解为 $m$ 。

Knapsnack

$n$ 的输入位数为 $⌊log⁡2n⌋+1\lfloor \log_2 n\rfloor + 1$ ：
- 给 $a1,a2,…,ana_1, a_2, \dots, a_n$ 排序，把 $max\{\log_2a_i\}$ 认为是常数，输入规模为 $n$ 。
- 判定 $N$ 是否为素数，输入规模为 $log_2N$ 。
背包问题的时间复杂度 $O(nB)\mathcal O(nB)$ ，输入规模只有 $log⁡B+log⁡n+∑i=1nlog⁡size(ai)+∑i=1nlog⁡profit(ai)\log B + \log n + \sum\limits_{i = 1}^{n}\log \text{size}(a_i) + \sum \limits_{i = 1}^{n}\log \text{profit}(a_i)$ ，有 $2^{\log B} = B$ ，是伪多项式算法。
unnary encoding 编码长度等于数字大小，记 $I|_u$ 表示输入 $I$ 在 unnary encoding 下的长度， $∣ I ∣$ 表示输入 $I$ 在 binary encoding 下的长度。
伪多项式算法 时间复杂度是 $I|_u$ 的多项式。
多项式算法 时间复杂度是 $∣ I ∣$ 的多项式。
strongly NP-hard 在 unnary encoding 下仍然是 NP-hard。一个 strongly NP-hard 问题没有伪多项式解法除非 P = NP。
weakly NP-hard 在 binary encoding 下是 NP-hard，但存在伪多项式算法。
设 $\max \text{profit}(a_i)$ ，设 $A [i, p]$ 表示前 $i$ 个物品的子集总价值为 $p$ 所能达到的最小容量，时间复杂度 $O(n2P)\mathcal O(n^2P)$ 。

$\begin{aligned} A[1,0] = 0, A[1,\text{profit}(a_1)] &= \text{size}(a_1),\forall 0 \le j \le nP, j \not = 1, j \not = \text{profit}(a_1), A[i,j] = \infty\\ A[i+1,p] &= \min\{A[i,p], \text{size}(a_{i + 1}) + A[i,p-\text{profit}(a_{i + 1})]\} \end{aligned}$

polynomial-time approximation scheme(PTAS，多项式时间近似方案) 一个算法 $A\mathscr{A}$ 满足对于给定参数 $ε>0\varepsilon > 0$ ，产生的解 $s$ 均满足 $∣objΠ(I,s)−OPT∣OPT≤ε\dfrac{|\text{obj}_{\Pi}(I,s) - \text{OPT}|}{\text{OPT}} \le \varepsilon$ 且 $A\mathscr{A}$ 的时间复杂度是 $∣ I ∣$ 的多项式。
fully polynomial-time approximation scheme(FPTAS，完全多项式时间近似方案) 一个算法满足 $A\mathscr{A}$ 满足 PTAS 对解的要求且运行时间是 $∣ I ∣$ 和 $1ε\dfrac{1}{\varepsilon}$ 的多项式。

KnapsackScaling( $I$ , $ε\varepsilon$ )

$\leftarrow \dfrac{\varepsilon P}{n}$
$profit′(ai):=⌊profit(ai)K⌋\text{profit}'(a_i) := \left\lfloor \dfrac{\text{profit}(a_i)}{K} \right\rfloor$
Compute optimal solution $S^{'}$ for $I$ w.r.t. $profit′(⋅)\text{profit}'(·)$
return $S^{'}$

该算法是 FPTAS。

证明设 $OPT={o1,o2,…,ok}\text{OPT} = \{o_1, o_2, \dots, o_k\}$

$profit(S′)≥Kprofit′(S′)≥∑i=1kKprofit′(oi)≥∑i=1kprofit(oi)−kK≥profit(S)−nK≥profit(S)−εP≥(1−ε)profit(S)\text{profit}(S') \ge K \text{profit}'(S') \ge \sum \limits_{i = 1}^{k}K\text{profit}'(o_i) \ge \sum \limits_{i = 1}^{k}\text{profit}(o_i) - kK \\ \ge \text{profit}(S) - nK \ge \text{profit}(S) - \varepsilon P \ge (1 - \varepsilon)\text{profit}(S)$

该算法的时间复杂度 $O(n2PK)=O(n3ε)\mathcal O\left(n^2\dfrac{P}{K}\right) = \mathcal O\left(\dfrac{n^3}{\varepsilon}\right)$

FPTAS 与伪多项式算法的关系 若存在多项式 $p$ ，使得对于一个具有整数目标函数的最小化问题任意 $OPT(I)<p(∣I∣u)\text{OPT}(I) < p(|I|_u)$ ，若该最小化问题存在一个FPTAS，则一定存在一个对应的伪多项式算法。

证明假设存在一个 FPTAS，取 $ε=1p(∣I∣u)\varepsilon = \dfrac{1}{p\left(|I|_u\right)}$
$\begin{cases}\text{ALG} \ge \text{OPT} \\ \text{ALG} \le (1 + \varepsilon) \text{OPT} < \text{OPT} + 1 \end{cases}\Rightarrow \text{ALG} = \text{OPT}$
该算法的时间复杂度是关于 $∣ I ∣$ 和 $p(|I|_u)$ 的多项式，即时间复杂度是 $I|_u$ 的多项式。

一个 strongly NP-Hard 问题有伪多项式算法，仅当 P = NP。
因此若一个 strongly NP-Hard 问题满足前述条件，有 FPTAS 仅当 P = NP。

Maximum Satisfiability

任何问题都能转化成 SAT，因为在计算机内本质上都是若干门电路的组合。
文字（literals） 变量或者变量取负。
子句（Clause） 文字的析取（disjunction），其长度为文字的个数。
给定一个 CNF（合取范式），有变量 $x1,…,xnx_1,\dots,x_n$ ，有子句 $C1,…,CmC_1,\dots,C_m$ ，对应的权为 $w1,…,wmw_1, \dots, w_m$ ，要求使得被满足的子句的权值和最大。

Randomized Algorithm

对 $x_i$ 随机取 0/1，每个子句被满足的概率大于等于 $12\dfrac{1}{2}$ ，所以这是一个期望 $α=12\alpha = \dfrac{1}{2}$ 的近似算法（注意和 $α=12\alpha = \dfrac{1}{2}$ 的区别）。

Derandomization by Conditional Expectation

去随机化能够得到一个 $α=12\alpha = \dfrac{1}{2}$ 的算法，对于每个 $x_{i+1}$ ，每次选择后续选择期望更大的决策，由归纳法
1. 基础
  $\begin{cases} \mathbb{E}(W) = \dfrac{\mathbb{E}(W|x_1 = 0) + \mathbb{E}(W|x_1 = 1)}{2} \ge \dfrac{\text{OPT}}{2}\\\mathbb{E}(W|x_1 = b_1) \ge \mathbb{E}(W|x_1 = 1 - b_1) \end{cases} \Rightarrow \mathbb{E}(W|x_1 = b_1) \ge \dfrac{\text{OPT}}{2}$
2. 归纳
  $\begin{cases} \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i) \ge \dfrac{\text{OPT}}{2} \\ \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i) = \dfrac{\mathbb{E}(W|x_1=b_1,\dots, x_i = b_i, x_{i + 1} = 0) + \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i, x_{i + 1} = 1)}{2} \\ \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i, x_{i + 1} = b_{i + 1}) \ge \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i, x_{i + 1} = 1 - b_{i + 1}) \\ \end{cases} \\ \Rightarrow \mathbb{E}(W|x_1=b_1,\dots, x_i = b_i, x_{i + 1} = b_{i + 1}) \ge \dfrac{\text{OPT}}{2}$
注意到 $E(W∣x1=b1,…,xn=bn)\mathbb{E}(W|x_1=b_1,\dots, x_{n} = b_{n})$ 是定值，故我们证明了其 $α=12\alpha = \dfrac{1}{2}$ 。
local consumption
- greedy, local search
global consumption
- backtrace, branch and bound, LP, divide and conquer, DP

LP

转成线性规划模型，令 $Cj=⋁i∈Pjxi∨⋁i∈Njxi‾C_j = \bigvee\limits_{i \in P_j}x_i \vee \bigvee\limits_{i \in N_j}\overline{x_i}$ ，

$\begin{aligned} \text{maximize}\hspace{0.5em}\sum\limits_{j = 1}^{m}w_jz_j &\\ \text{subject to}\hspace{0.5em}\sum\limits_{i \in P_j}y_i + \sum \limits_{i \in N_j}(1 - y_i) &\ge z_j & \forall 1\le j\le m\\ 0 \le y_i \le 1& & \forall 1\le i\le n\\ 0 \le z_j \le 1& & \forall 1\le j\le m\\\\ \end{aligned}$

设求出的解为 $y^*, z^*)$ ，则以 $y^*_i$ 的概率置 $x_i$ 为 1 可得到一个期望 $α=1−1e\alpha = 1 - \dfrac{1}{e}$ 的近似算法。

（分析过程不考）

证明

由均值不等式

$\begin{aligned} \dfrac{n}{\sum \limits_{i = 1}^{n}\dfrac{1}{a_i}}&\le \sqrt[n]{\prod\limits_{i = 1}^{n}a_i}\le \dfrac{\sum\limits_{i = 1}^{n}a_i}{n}\le \sqrt{\dfrac{\sum \limits_{i = 1}^{n}a_i^2}{n}} \\ 调和平均数 &\le 几何平均数 \le 算术平均数 \le 平方平均数 \end{aligned}$

考虑此时某个子句 $C_j$ 不满足的概率

$\begin{aligned} &\prod_{i \in P_j}(1 - y_i^*)\prod\limits_{i \in N_j}y_i^* \\ &\le \left[\dfrac{1}{l_j}\left(\sum \limits_{i \in {P_j}}(1 - y_i^*)+\sum \limits_{i \in N_j}y^*_i\right)\right]^{l_j}\\ & = \left[1 - \dfrac{1}{l_j}\left(\sum \limits_{i \in P_j}y_j^* + \sum\limits_{i \in N_j}(1 - y^*_j)\right)\right]^{l_j}\\ &\le \left(1 - \dfrac{z_j}{l_j}\right)^{l_j}\\ \end{aligned}$

因此 $C_j$ 满足的概率大于等于 $f(zj)=1−(1−zjlj)ljf(z_j) = 1 - \left(1 - \dfrac{z_j}{l_j}\right)^{l_j}$ 。
注意到 $∀zj∈[0,1],f′(zj)≥0,f′′(zj)≤0\forall z_j \in [0, 1], f'(z_j) \ge 0, f''(z_j) \le 0$ ，若 $f (0) = a, f (1) = a + b$ ，恒有 $\ge bx + a$ ，并且根据 $\le e^x$ ，有

$\begin{aligned} 1 - \left(1 - \dfrac{z_j}{l_j}\right)^{l_j} &\ge \left[1 - \left(1 - \dfrac{1}{l_j}\right)^{l_j}\right]z_j \\ &\ge \left(1 - \dfrac{1}{e}\right)z_j\\ \end{aligned}$

此时

$\mathbb{E}(W) = \sum \limits_{j = 1}^{m}\left(1 - \dfrac{1}{e}\right)w_jz_j \ge \left(1 - \dfrac{1}{e}\right)\text{OPT}_{LP} \ge \left(1 - \dfrac{1}{e}\right)\text{OPT}_{ILP}$

同样可以通过条件期望将上述算法改为 $α=(1−1e)\alpha = \left(1 - \dfrac{1}{e}\right)$ 的近似算法，每次选择期望下界更大的决策，证明同上。

Take the better of the two solution

假设以 $12\dfrac{1}{2}$ 的概率随机选择 Randomized Algorithm 和 LP 两种算法之一，某个子句 $C_j$ 满足的概率至少为：

$\dfrac{1}{2}\left\{\left[1 - \left(1 - \dfrac{1}{l_j}\right)^{l_j}\right]z_j + (1 - 2^{-l_j})\right\} \ge\dfrac{1}{2}\left\{\left[1 - \left(1 - \dfrac{1}{l_j}\right)^{l_j}\right] + (1 - 2^{-l_j})\right\}z_j$

容易证明这两个函数的均值 $≥0.75\ge 0.75$ ，因此我们得到了期望 $α=34\alpha = \dfrac{3}{4}$ 的近似算法，同上可以通过条件期望优化到 $α=34\alpha = \dfrac{3}{4}$ 的近似算法（选两种方法期望值取 $max⁡\max$ 最大的选项）。

Minimum-Degree Spanning Tree

给定一个连通图 $G = (V, E)$ ，找到一棵生成树 $T$ ，使得最大度数 $Δ(T)\Delta(T)$ 最小。
该问题是 NP-hard 问题，因为 $\ge 3$ 时恒有 $Δ(T)≥2\Delta(T) \ge 2$ ，而 $Δ(T)=2\Delta(T) = 2$ 的生成树 $T$ 是一条路径。若能求出最优解 $T^*$ ，相当于判定了图中是否存在哈密顿回路，因而哈密顿回路只是该问题的一个子集。
$degT(u)\text{deg}_T(u)$ 表示 $T$ 中 $u$ 的度数。
improving flip 对于 $T$ 中的结点 $v$ ，存在 $\in E(G)/E(T)$ ， $v$ 在 $T$ 中 $u$ 到 $w$ 的路径上且 $degT(v)>max⁡{degT(u),degT(w)}+1\text{deg}_T(v) > \max\{\text{deg}_T(u),\text{deg}_T(w)\} + 1$ ，删去在 $T$ 中 $u$ 到 $w$ 路径上且与 $v$ 相邻的边，增加边 $(u, w)$ ，得到新的生成树 $T^{'}$ 。
取 $\lceil \log_2 n \rceil$

MinDegSpanningTreeLocalSearch( $G$ )

$T$ <- any spanning tree of $G$
while $∃\exist$ improving flip in $T$ for a vertex $v$ with $degT(v)≥Δ(T)−l\text{deg}_T(v) \ge \Delta(T) - l$ do

do the improving flip

可以证明，算法可在 $O(n4)\mathcal O(n^4)$ 次迭代后结束。
对于 $G$ 的任意一棵生成树 $T$ ，删去 $T$ 中 $k$ 条边将 $T$ 分为 $k + 1$ 个连通块，设 $E^{'}$ 为 $E (G)$ 中连接不同连通块的所有边，取 $S$ 是 $E^{'}$ 的点覆盖。
Lemma 1. $OPT≥k∣S∣\text{OPT} \ge \dfrac{k}{|S|}$ 。

证明 $∣S∣OPT=∣S∣Δ(T∗)≥∑v∈SdegT∗(v)≥∣E(T∗)∩E′∣|S|\text{OPT} = |S|\Delta(T^*) \ge \sum_{v\in S}\text{deg}_{T^*}(v) \ge |E(T^*)\cap E'|$

因为 $T^*$ 是生成树，不考虑这 $k + 1$ 个连通块内部连边的情况，至少要用 $k$ 条边让这 $k + 1$ 个连通块连通，故 $∣E(T∗)∩E′∣≥k|E(T^*)\cap E'|\ge k$ ，移项后即有 $OPT≥k∣S∣\text{OPT} \ge \dfrac{k}{|S|}$ 。

对于 $G$ 通过上述算法得到的一棵生成树 $T$ ， $∀1≤i≤Δ(T)\forall 1 \le i \le \Delta(T)$ ，令 $Si={v∣v∈V(G)∧degT(v)≥i}S_i = \{v | v\in V(G)\wedge \text{deg}_T(v) \ge i\}$ ， $Ei={(u,v)∣(u,v)∈T∧(u∈Si∨v∈Si)}E_i = \{(u,v)|(u,v) \in T\wedge (u \in S_i\vee v\in S_i)\}$ ，
Lemma 2. 若 $Δ(T)≥l\Delta(T) \ge l$ ， $∃i≥Δ(T)−l+1,∣Si−1∣≤2∣Si∣\exist i \ge \Delta(T) - l + 1, |S_{i - 1}| \le 2|S_i|$

证明反证法，假设不存在，则有 $∣SΔ(T)−l∣>2l∣SΔ(T)∣=2⌈log⁡2n⌉∣SΔ(T)∣≥n|S_{\Delta(T) - l}| > 2^l|S_{\Delta(T)}| = 2^{\lceil\log_2n\rceil}|S_{\Delta(T)}| \ge n$ ，矛盾。

Lemma 3. 若 $Δ(T)≥l\Delta(T) \ge l$ ， $∀i≥Δ(T)−l+1\forall i \ge \Delta(T) - l + 1$
1. $∣Ei∣≥(i−1)∣Si∣+1|E_i| \ge (i - 1)|S_i| + 1$
2. 对于每条连接 $T/E_i$ 不同连通块且满足 $e∈E(G)/Eie\in E(G)/E_i$ 的边 $e$ 至少有一个顶点属于 $S_{i - 1}$ 。

证明 1. $∣Ei∣≥i∣Si∣−(∣Si∣−1)=(i−1)∣Si∣+1|E_i| \ge i|S_i| - (|S_i| - 1) = (i - 1)|S_i| + 1$ （最坏情况下 $S_i$ 中的点形成一棵树，因此要扣掉重复的边）

显然满足该条件的边 $e$ 两个顶点在 $T$ 中的度数均小于 $i$ ，若两者的度数均小于 $i - 1$ 。由于边 $e$ 连接的两个连通块之间一定存在一条属于 $E_i$ 的边，则可以进行一次 improving flip，与 $T$ 的定义不同。

Theorem. $Δ(T)≤2OPT+l\Delta(T) \le 2\text{OPT} + l$

证明

若 $Δ(T)<l\Delta(T) < l$ ，显然该结论成立。

若 $Δ(T)≥l\Delta(T) \ge l$ ，取 **Lemma 2. *** 中的 $i$ ，删去 $T$ 中的边集 $E_i$ 得到 $E_i| + 1$ 个连通块，由 **Lemma 3. (2) ** $S_{i - 1}$ 一定是 $E(G) / E_i$ 的点覆盖，结合 Lemma 1.、Lemma 2.、Lemma 3 有

$\text{OPT} \ge \dfrac{k}{|S|} = \dfrac{|E_i|}{|S_{i - 1}|} \ge \dfrac{(i - 1)|S_i| + 1}{|S_{i - 1}|} \ge \dfrac{(i - 1)|S_i| + 1}{2|S_i|} > \dfrac{i - 1}{2} \ge \dfrac{\Delta(T) - l}{2}$

若取 $\lceil \log_b n\rceil$ ，用与 Lemma 2. 相同的方法证明若 $Δ(T)≥l\Delta(T) \ge l$ ， $∃i≥Δ(T)−l+1,∣Si−1∣≤b∣Si∣\exist i \ge \Delta(T) - l + 1, |S_{i - 1}| \le b|S_i|$ ，最终能够得出 $Δ(T)≤bOPT+l\Delta(T) \le b\text{OPT} + l$ 的结论。

Local Search

Given an instance $I$ of a problem， $S (I)$ the set of feasible solutions

For a Solution $S$ ，the neighborhood of $S$ （邻域）is the set of all solutions $S^{'}$ such that $S^{'}$ can be obtained from $S$ via some local moves.

minimization $val(S′)<val(S)\text{val}(S') < \text{val}(S)$

maximization $val(S′)>val(S)\text{val}(S') > \text{val}(S)$

Find a good(comparatively, no constraints) initial solution $S0∈S(I)S_0 \in S(I)$

$\leftarrow S_0$

repeat

if $∃S′∈N(S)\exists S' \in N(S)$ such that $val(S′)\text{val}(S')$ is better than $val(S)\text{val}(S)$

$S←S′S\leftarrow S'$ ;

else

$S$ is a local optimal;
return $S$ ;

until true;

The upper bound for iterations is $∣OPT−val(S0)∣|\text{OPT} - \text{val}(S_0)|$ .

Objective

find $S^{'}$ polynomial time?
repeat polynomial time?

Max Cut

Given an undirected graph $V = (G, E)$ ，the goal is to partition $V$ into $(S, V / S)$ so as to maximize the number of edges crossing $S$ (outgoing edges, $σ(S)\sigma(S)$ )

weighted version：each edge has non-negative weight, the goal is to maximize the weights of edges crossing $S$ .

LScut:

$\varnothing$

repeat

if $∃v∈V/S\exists v \in V / S$ such that $w(σ(S+v))>w(σ(S))w(\sigma(S + v)) > w(\sigma(S))$

$\leftarrow S + v$ ;

else if $∃v∈S\exists v \in S$ such that $w(σ(S−v))>w(σ(S))w(\sigma(S - v)) > w(\sigma(S))$

$\leftarrow S - v$ ;

else

$S$ is a local optimal;
return $S$ ;

until true

Lemma 1. $S$ is the output

$∃v,w(σ(S)∩σ(v))≥w(σ(v))2\exists v, w(\sigma(S)\cap\sigma(v)) \ge \dfrac{w(\sigma(v))}{2}$
Lemma 2. $w(σ(S))≥w(E)2≥OPT2w(\sigma(S)) \ge \dfrac{w(E)}{2} \ge \dfrac{\text{OPT}}{2}$

Proof. According to Handshaking theorem， $∑v∈Vw(σ(v))=2w(E)\sum \limits_{v \in V}w(\sigma(v)) = 2w(E)$

$w(σ(S))=12∑v∈Vw(σ(S)∩σ(v))≥12∑v∈Vw(σ(v))2=12w(E)≥OPT2w(\sigma(S)) = \dfrac{1}{2}\sum \limits_{v \in V}w(\sigma(S)\cap\sigma(v))\ge \dfrac{1}{2}\sum \limits_{v \in V}\dfrac{w(\sigma(v))}{2} = \dfrac{1}{2}w(E) \ge \dfrac{\text{OPT}}{2}$

For unweighted graph, it runs for at most $∣ E ∣$ times.

But running time may take exponential time when weights are large.

objective

the running time is strongly polynomial
the quality of solution is almost optimal

$n = ∣ V ∣$

Modified LScut( $ε\varepsilon$ )

$\leftarrow \{v^{*}\}, v^* = \arg \max \limits_{v \in V}\{w(\sigma(v))\}$

repeat

if $∃v∈V/S\exists v \in V / S$ such that $w(σ(S+v))>(1+εn)w(σ(S))w(\sigma(S + v)) > \left(1 + \dfrac{\varepsilon}{n}\right)w(\sigma(S))$ then $\leftarrow S + v$ ；
>
else if $∃v∈S\exist v \in S$ such that $w(σ(S−v))>(1+εn)w(σ(S))w(\sigma(S - v)) > \left(1 + \dfrac{\varepsilon}{n}\right)w(\sigma(S))$ then $\leftarrow S - v$ ；
>
else return $S$ ；

Lemma 1. $S$ is the output, $w(σ(S))≥12(1+ε4)w(E)w(\sigma(S)) \ge \dfrac{1}{2\left(1 + \dfrac{\varepsilon}{4}\right)}w(E)$

Proof. Assuming $αv=w(σ(S)∩σ(v)),βv=w(σ(v))−αv\alpha_v = w(\sigma(S)\cap\sigma(v)), \beta_v = w(\sigma(v)) - \alpha_v$
$\begin{aligned} \forall v, w(\sigma(S)) - w(\sigma(S)\cap \sigma(v)) + w(\sigma(v)) - w(\sigma(S)\cap \sigma(v)) &\le \left(1 + \dfrac{\varepsilon}{n}\right)w(\sigma(S)) \\ \Leftrightarrow \forall v, \beta_v - \alpha_v &\le \dfrac{\varepsilon}{n}w(\sigma(S)) \\ w(\sigma(S)) &= \dfrac{1}{2}\sum\limits_{v \in V}\alpha_v \\ &= \dfrac{1}{2}\sum \limits_{v \in V}\dfrac{[(\beta_v + \alpha_v) - (\beta_v - \alpha_v)]}{2}\\ &\ge \dfrac{1}{4}\sum\limits_{v \in V}[w(\sigma(v)) - \dfrac{\varepsilon}{n}w(\sigma(S))] \\ &= \dfrac{1}{2}w(E) - \dfrac{\varepsilon}{4}w(\sigma(S)) \\ \Leftrightarrow w(\sigma(S)) &\ge \dfrac{1}{2\left(1 + \dfrac{\varepsilon}{4}\right)}w(E) \end{aligned}$

Lemma 2. The time complexity of Modified LScut is $O(1εnlog⁡n)\mathcal O\left(\dfrac{1}{\varepsilon} n \log n\right)$

**Proof. ** According to Pigeonhole principle and Handshaking theorem，
$\begin{aligned} \sum \limits_{v \in V}w(\sigma(v)) = 2w(E) \Rightarrow w(S_0) = w(\sigma(v^*)) \ge \dfrac{2}{n}w(E) \end{aligned}$
Assuming the number of iterations is $k$ ,
$\begin{aligned} (1 + \dfrac{\varepsilon}{n})^kw(\sigma(S_0)) &\le w(\sigma(S)) \\ (1 + \dfrac{\varepsilon}{n})^k\dfrac{2}{n}w(E)&\le w(E) \\ \left(1 + \dfrac{\varepsilon}{n}\right)^k &\le \dfrac{n}{2} \\ \end{aligned}$
According to $lim⁡n→∞(1+εn)nε=e\lim \limits_{n \to \infty}\left(1 + \dfrac{\varepsilon}{n}\right)^{\frac{n}{\varepsilon}} = e$ ， $eεnk≤n2⇒k=O(nlog⁡nε)e^{\frac{\varepsilon}{n}k} \le \dfrac{n}{2} \Rightarrow k = \mathcal O\left(\dfrac{n \log n }{\varepsilon}\right)$

Center Based Clustering

Euclidean Space

$\parallel x - y\parallel$

metric space

设 $V$ 为点集，存在一个映射一个映射 $V\times V \to R$ ， $∀u,v,w∈V\forall u,v,w\in V$
1. $d (u, v) = d (v, u)$
2. $\ge 0$ 且 $\Leftrightarrow u = v$
3. $\le d(u, v) + d(v,w)$
若 $A,B⊆V,p∈VA,B\subseteq V, p \in V$ ，
- $\min\limits_{p \in A, q\in B}d(p,q)$
- $\min\limits_{q\in A}d(p,q)$

Given $n$ points $\{p_1, \dots, p_n\}$ in metric space $(V, d)$ , an integer $k$ , the goal is to partition $P$ into $k$ clusters $C1,…,CkC_1, \dots, C_k$ obtained by choosing $c1∗,…,ck∗c_1^*, \dots, c_k^*$ .

Rule: each point $p_i$ is assigned to its nearest center from $c1∗,…,ck∗c_1^*,\dots,c_k^*$

Quality: choose $c1∗,…,ck∗c_1^*, \dots, c_k^*$ to minimize $∑i=1nd(pi,{c1∗,…,ck∗})q\sum \limits_{i = 1}^{n}d(p_i,\{c_1^*,\dots,c^*_k\})^q$ , $q$ is a constant.

k-center $\infty \Rightarrow \min\limits_{c_1^*,\dots,c^*_k\in V} \max\limits_{i = 1}^{n}d(p_i,\{c_1^*,\dots,c_k^*\})$
k-median（均值） $\Rightarrow \min\limits_{c_1^*, \dots, c_k^*}\sum\limits_{i = 1}^{n}d(p_i,\{c_1^*,\dots, c_k^*\})$
k-means $\Rightarrow \min\limits_{c_1^*, \dots, c_k^*}\sum\limits_{i = 1}^{n}d(p_i,\{c_1^*,\dots, c_k^*\})^2$

K-center

Gonzalez-k-center ( $P$ , $k$ )

choose $c_1$ arbitrary.

$\leftarrow \{c_1\}$ .

for i = 2 to $k$ do

$ci=arg⁡max⁡c∈Pd(c,C)c_i = \arg \max\limits_{c \in P}d(c,C)$
$\leftarrow C \cup\{c_i\}$

output $C$

Lemma 1. suppose $k + 1$ points $q1,…,qk+1∈Pq_1,\dots,q_{k+1} \in P$ such that $d(qi,qj)>2R,i≠j⇒OPT>Rd(q_i, q_j) > 2R, i\not = j \Rightarrow \text{OPT}>R$

Proof. suppose $OPT≤R\text{OPT} \le R$

$∃C={c1,…,ck}⇒C1,…,Ck\exists C = \{c_1, \dots, c_k\} \Rightarrow C_1, \dots, C_k$

$∀Ch,p∈Ch,d(p,ch)≤R\forall C_h, p \in C_h, d(p, c_h) \le R$

According to Pigeonhole principle, $∃qi,qj∈Ch,d(qi,qj)≤d(qi,ch)+d(qj,ch)≤2R\exists q_i,q_j \in C_h,d(q_i,q_j) \le d(q_i,c_h) + d(q_j,c_h) \le 2R$ contradiction.

Theorem 1. $C$ is returned. $\max\limits_{p \in P}d(p,C)$ ， $\le 2R^*$ ， $R^*$ means the optimal solution.

Proof. suppose $2R^{*} \Rightarrow$ （每次取出 $c_i$ 时 $d(c_i, C)$ 是递减的）

$∃p∈P,d(p,C)>2R∗⇒∀2≤i≤k,d(ci,{c1,…,ci−1})>2R∗\exist p \in P, d(p, C) > 2R^* \Rightarrow \forall 2 \le i \le k, d(c_i, \{c_1, \dots, c_{i - 1}\}) > 2R^*$

${p,c1,…,ck}\{p, c_1, \dots, c_k\}$ satifies the condition of **Lemma 1. **, so $OPT>R∗\text{OPT} > R^*$ ，contradition.

Define $∀v,radiusr,B(v,r)={u∣d(u,v)≤r}\forall v, \text{radius}\hspace{0.5em} r, B(v,r) = \{u|d(u, v) \le r\}$

HS-k-center ( $P$ , $k$ )

Guess $R^*$ the optimal radius (binary search, the bound is $[min⁡pi,pj∈P,pi≠pjd(pi,pj),max⁡pi,pj∈Pd(pi,pj)][\min\limits_{p_i,p_j\in P, p_i \not = p_j} d(p_i, p_j),\max\limits_{p_i,p_j \in P} d(p_i,p_j)]$ ).

$\leftarrow \varnothing, S \leftarrow P$

while $\not = \varnothing$ do

let $c$ be an arbitrary point in $S$

$\leftarrow C \cup \{c\}$

$\leftarrow S/B(c,2R^*)$

output $C$

Lemma 2. For a guess $R$ , return $C$ , $∀p∈P,d(p,C)≤2R\forall p \in P, d(p,C) \le 2R$ ，if $\ge R^*$ ， $\le k$

Proof. Assume $c1,c2,…,chc_1, c_2,\dots, c_h$ are centers chosen, $d(ci,{c1,…,ci−1})>2Rd(c_i, \{c_1, \dots, c_{i - 1}\}) > 2R$ ，if $\ge k + 1$ , according to **Lemma 1. **, $R^* > R$ ，contradiction. So $\le k$ .

所以通过二分法找到的解一定满足 $ALG=2R≤2R∗\text{ALG} = 2R \le 2R^{*}$ ，即 $α=2\alpha = 2$ 。

K-median

LP form：
$\begin{aligned} \text{minimize} \hspace{0.5em} \sum\limits_{j \in D}\sum\limits_{i \in F}x_{ij}&d(i, j) \\ \text{subject to} \hspace{0.5em} \sum \limits_{i \in F}x_{ij} &= 1 & j \in D\\ x_{ij} &\le y_i & i \in F, j \in D\\ \sum \limits_{i \in F}y_i &\le k\\ y_i,x_{ij}&\ge 0 & i \in F, j \in D \\ \end{aligned}$

随机选 $k$ 个点，每次给定一个参数 $P$ ，随机选 $P$ 个点换入再选 $P$ 个点换出，每次选取获得代价最小的方案，直到无法继续迭代下去。

Theorem. $P$ -swap local search has ratio of $(3+2p)\left(3 + \dfrac{2}{p}\right)$ .

K-means

Euclidean $K$ -means 参见 Machine Learning

Lloyds-k-means( $X$ , $k$ )

pick $k$ centers $c1,…,ckc_1, \dots, c_k$

repeat

(1) find $x}C_1, \dots, C_k, C_i = \{x| x\in X,c_i\text{is closest to } x\}$

(2) $cost=∑i=1k∑x∈Cid(x,ci)2\text{cost} = \sum\limits_{i = 1}^{k}\sum \limits_{x \in C_i}d(x,c_i)^2$

(3) for $i$ = 1 to $k$ do $ci=1∣Ci∣∑x∈Cixc_i = \dfrac{1}{|C_i|}\sum \limits_{x \in C_i}x$

until cost improvement is small;

output $C1,…,CkC_1, \dots, C_k$ .

初始化 $c_i$ 为离集合 ${c1,…,ci−1}\{c_1,\dots,c_{i - 1}\}$ 最远的点。

$D^2$ -sampling-k-means++( $X$ , $k$ )

$S = \{c_1\}$ , $c_1$ is randomly chosen;

for $i$ = 2 to $k$ do

(1) choose $c_i$ randomly with $p(ci=x)≈d(x,S)2∑ud(u,S)2p(c_i = x) \approx \dfrac{d(x,S)^2}{\sum_u d(u,S)^2}$

(2) $\leftarrow S \cup \{c_i\}$

output $S$ .