多切割重排排序与图索引在字符串匹配中的复杂性分析
1. 多切割重排排序问题
多切割重排排序(Sorting by Multi - cut Rearrangements)是对不包含反转操作的常见基因组重排问题的一种推广。下面我们来详细分析其相关性质。
1.1 判定问题的复杂性
- 对于奇数 $k \geq 5$,判定一个 $k$ - 循环对 $(S, T)$ 是否能 $k$ - 高效排序是 NP - 难问题。对于偶数 $k \geq 6$,判定一个对 $(S, T)$ 是否能 $k$ - 高效排序同样是 NP - 难问题。证明采用归纳法,已知判定一个 3 - 循环对 $(S, T)$ 是否能高效排序是 NP - 难问题。对于 $k \geq 5$,若 $k$ 为奇数则取 $p = 2$,否则取 $p = 3$,通过相关引理和命题可得到多项式归约,从而证明其复杂性。
- 定理 7 是引理 6 的推论,因为一个 $k$ - 循环对 $(S, T)$ 能 $k$ - 高效排序当且仅当 $S$ 能通过不超过 $\frac{d_{b}(S,T)}{k}$ 次 $k$ - 切割重排转换为 $T$。
1.2 优化问题的近似性
Opt - SMCR 是 SMCR 的优化版本,目标是找到通过 $k$ - 切割重排从 $S$ 得到 $T$ 所需的最小 $\ell$。定理 8 表明 Opt - SMCR 在排列问题中是 2 - 可近似的。具体算法步骤如下:
设 $I=(S, T, k)$ 是 Opt - SMCR 的一个实例。
1. 首先将 $S$ 和 $T$ 重写为 $S’$ 和 $T’$,