51、在线区间与 t-区间选择问题研究

c6d7e8f9g

于 2025-10-14 13:45:09 发布

阅读量40

点赞数

CC 4.0 BY-SA版权

分类专栏：算法世界的探索之旅文章标签：在线区间选择 t-区间选择竞争比

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/153554160

算法世界的探索之旅专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

在线区间与 t-区间选择问题研究

1. 引言

区间调度是一种资源分配问题，机器作为资源。在过去几十年里，运营管理从资源导向的物流（资源可用性决定作业规划和完成）转变为需求导向的物流（作业及其完成基本固定，需寻找合适资源），这意味着从传统调度向区间调度转变。

假设在线运营一个资源，客户不时请求使用，时长最多为 t 个时间段，且时间段长度不一定相同。这些请求要么被接受，要么被拒绝。若接受请求，资源将在相应时间段被占用；若请求的时间段与已接受请求的时间段有交集，则该请求不能被接受。目标是尽可能多地接受请求。

这可以建模为在线 t-区间选择（t-Isp）问题。t 表示任何请求涉及的最大时间段数，每个请求用一个 t-区间表示，即实线上最多 t 个半开区间（称为段）的并集。t-区间逐个到达，需在单台机器上进行非抢占式调度。两个 t-区间 I 和 J 不相交，当且仅当它们的段都不相交；若一个段与另一个段相交，则它们相交。t-区间到达时，调度器需决定是否接受，若不接受则永远失去该请求。目标是选择一个不相交 t-区间的子集（即“形成一个调度”），使其基数最大。当 t = 1 时，该问题称为在线区间选择问题（Isp）。

在线算法的性能用竞争比衡量。形式上，设 OPT 是该问题的最优离线算法，算法 A 的竞争比定义为 $\sup_{\sigma} \frac{OPT(\sigma)}{A(\sigma)}$，其中 $\sigma$ 是输入序列，$OPT(\sigma)$ 和 $A(\sigma)$ 分别是 OPT 和 A 选择的 t-区间数量。对于随机算法，用期望 $E[A(\sigma)]$ 代替 $A(\sigma)$，竞争比定义为 $\rho_A = \sup_{\sigma} \frac{OPT(\sigma)}{E[A(\sigma)]}$。竞争比至多为 $\rho$ 的算法称为 $\rho$-竞争算法。设 n 是实例中的区间数量，$\Delta$ 表示最长和最短段长度的比率。

2. 相关工作

区间和 t-区间选择 ：t-Isp 可视为在 t-区间图中寻找最大独立集（IS）的问题。对于区间图的特殊情况，该问题可多项式求解；但当 t = 2 时，IS 问题变为 APX 难问题。有文献提出了离线加权 tISP 的 2t-近似算法，后续工作扩展到带需求的 t-区间选择以及 t-区间图上其他优化问题的研究。
在线区间选择 ：Lipton 和 Tomkins 考虑了一个在线区间选择问题，其中区间的权重与其长度成比例，且区间按时间（即左端点顺序）到达。他们表明，当 $\Delta$ 已知时，$\theta(\log \Delta)$ 竞争因子是最优的；当 $\Delta$ 未知时，引入了一种技术可得到 $O(\log^{1 + \epsilon} \Delta)$ 竞争因子。Woeginger 考虑了加权 Isp 的抢占式版本，并给出了最优的 4-竞争算法。Kierstead 和 Trotter 给出了一个 3-竞争算法用于最小化机器数量的区间调度问题。t-Isp 问题与 JISP 问题有相似之处，但在 JISP 中，只需选择作业的一个可能段即可。
呼叫准入 ：Isp 可视为在线上的呼叫准入问题，目标是最大化接受的呼叫数量。有文献提出了一个强 $\lceil\log N\rceil$-竞争算法，当 $\Delta$ 已知时，可得到一般 Isp 实例的 $O(\log \Delta)$ 竞争算法。

3. 研究结果

我们首次推导了在线 t-Isp 算法竞争比的上下界，以及 Isp 的新的或改进的界。以下是不同类型实例的随机算法竞争比结果总结：
| 问题类型 | Isp（上界） | Isp（下界） | 2-Isp（上界） | 2-Isp（下界） | t-Isp（上界） | t-Isp（下界） |
| — | — | — | — | — | — | — |
| 一般输入 | $O(\log^{1 + \epsilon} \Delta)$ | $\Omega(\log \Delta)$ | $O(\log^{2 + \epsilon} \Delta)$ | $\Omega(\log \Delta)$ | - | - |
| 两种长度 | 4 | 4 | 16 | 6 | - | - |
| 单位长度 | 2 | 2 | 4 | 3 | 2t | $\Omega(t)$ |
| 有界深度 s | 3/2 (s = 2) | 2 - 1/s | - | - | - | - |

4. 堆叠构造技术

在推导随机算法的（t-）区间选择问题的下界时，使用堆叠构造技术。对手可以利用能预见算法选择任何给定动作的概率这一事实，将区间堆叠起来，直到某个区间被选择的概率足够低，然后利用这一点迫使算法得到不理想的结果。

设 R 是一个 Isp 算法，给定参数 q 和 x。一个 (q, x)-堆叠构造如下：形成 q 个单位区间 $I_1, \ldots, I_q$，它们相互重叠，左端点向左间隔 $x/q$。即 $I_i = [x(1 - i/q), 1 + x(1 - i/q))$，$i = 1, \ldots, q$。设 $p_i$ 是 R 选择 $I_i$ 的（无条件）概率，对手知道 $p_i$ 的值并据此构造输入序列。设 m 是使得 $p_m \leq 1/q$ 的最小的值，输入序列构造为 $\langle I_1, I_2, \ldots, I_m, J_m\rangle$，其中 $J_m = [1 + x(1 - m/q), 2 + x(1 - m/q))$。

一个 (q, x)-堆叠构造 I 具有以下性质：
1. I 中除 $I_m$ 外的所有区间都与段 $[1, 1 + x)$ 重叠。
2. I 中的所有区间都包含在区间 $[0, 2 + x)$ 内。
3. I 中除 $I_m$ 外的区间有一个长度为 $x/q$ 的公共交集，由段 $X = I_{m - 1} \cap J_m = [1 + x(1 - m/q), 1 + x(1 - (m - 1)/q))$ 给出。
4. $E_R[I_m] = p_m \leq 1/q$，因此 $E_R[I] \leq 1 + 1/q$。
5. $OPT(I) = 2$，因此 R 的性能比至少为 $2/(1 + 1/q)$。

通过取 q 任意大，可得到任何随机在线单位区间 Isp 算法的竞争比至少为 2。

5. 在线区间选择

5.1 单位区间与深度

对于 Isp 的单位区间问题，我们给出竞争比的上下界，问题以区间系统的深度（即重叠公共点的最大区间数）为参数。

任何随机在线单位区间 Isp 算法的竞争比至少为 $2 - 1/s$，其中 s 是实例的深度。证明过程是对 (s, 1)-堆叠构造进行修改，根据算法选择区间的概率进行不同处理，以得到期望的竞争比。

对于 s = 2 的情况，提出 RoG（随机或贪心）算法，该算法处理到达的区间如下：若区间与之前的区间不重叠，以 2/3 的概率选择；否则，贪心选择。该算法对于深度为 2 的单位区间是 3/2-竞争的。证明过程基于实例的深度限制，将区间分为三种类型，计算算法选择区间的期望数量和最优解的数量，从而得到竞争比。

5.2 两种长度的区间

对于 Isp 实例，当区间有两种不同长度 1 和 d 时，通过经典的分类选择方法（抛硬币选择单位区间或长度为 d 的区间，然后仅贪心添加该长度的区间）可得到一个 4-竞争算法。并且，任何随机在线具有两种长度区间的 Isp 算法的性能比渐近至少为 4。

5.3 含参数 n 的 Isp

Isp 对于无区间大小约束的实例，确定性算法较难处理。随机算法对于无约束实例也有线性下界。任何随机在线 Isp 算法的竞争比为 $\Omega(n)$。证明过程通过构造一个区间序列，将区间分为“好”区间和“坏”区间，计算算法接受区间的期望数量和最优解的期望数量，从而得到竞争比。

6. 在线 2-区间选择

对于单位段的 2-Isp 问题，任何随机在线算法的竞争比至少为 3。证明过程通过构造 2-区间 (q’, 1)-堆叠构造，根据算法选择区间的概率进行不同处理，若概率小于 2/3 则停止构造，若概率大于等于 2/3 则继续构造更多堆叠，最终得到竞争比至少为 3 的结论。

mermaid 格式流程图如下：

graph TD
    A[开始] --> B[构造 2-区间 (q', 1)-堆叠构造 I]
    B --> C{ER[Im] ≤ 1/q'}
    C -- 是 --> D{选择 I' 中区间概率 p < 2/3}
    D -- 是 --> E[停止构造，计算竞争比]
    D -- 否 --> F[形成 (q, x)-堆叠构造 I1 和 I2]
    C -- 否 --> F
    F --> G[完成构造，分析竞争比]

以下是总结的关键结论列表：
1. 在线区间与 t-区间选择问题在资源分配中有重要应用，从传统调度向区间调度转变体现了其实际意义。
2. 通过堆叠构造技术可推导随机算法的下界。
3. 对于不同类型的区间选择问题（单位区间、两种长度区间、含参数 n 的区间、2-区间等），得到了相应的竞争比上下界。
4. 提出了 RoG 算法，在特定条件下能达到较好的竞争比。

在线区间与 t-区间选择问题研究

7. 在线 t-区间选择的进一步分析

在前面我们已经对在线 Isp 和 2-Isp 问题进行了较为详细的探讨，接下来我们将对更一般的 t-Isp 问题进行分析。虽然目前对于 t > 2 的 t-Isp 问题，我们还没有得到像 Isp 和 2-Isp 那样全面的结果，但可以基于已有的方法进行一些思考和推测。

从堆叠构造技术来看，我们可以尝试将其扩展到 t-Isp 问题。对于 t 个半开区间组成的 t-区间，我们可以在每个半开区间上分别进行堆叠构造。例如，对于一个 t-区间，我们可以在其每个段上都进行类似 (q, x)-堆叠构造的操作。不过，随着 t 的增大，问题的复杂度会显著增加，因为需要考虑更多段之间的相互关系。

在竞争比方面，我们已经知道对于单位长度的 t-Isp 问题，上界为 2t，下界为 $\Omega(t)$。这表明随着 t 的增大，算法的性能会逐渐变差。我们可以推测，对于更一般的 t-Isp 问题，竞争比可能会与 t 和 $\Delta$ 都有关系。例如，对于一般输入的 t-Isp 问题，竞争比可能会是关于 $\log \Delta$ 和 t 的一个函数。

8. 算法性能对比与分析

为了更直观地了解不同算法在不同问题上的性能，我们可以对前面提到的算法进行对比分析。以下是一个对比表格：
| 问题类型 | 算法 | 竞争比 |
| — | — | — |
| 单位区间（深度 s = 2） | RoG | 3/2 |
| 两种长度区间 | 分类选择 | 4 |
| 含参数 n 的 Isp | - | $\Omega(n)$ |
| 单位段 2-Isp | - | 3 |

从这个表格中我们可以看出，不同的算法在不同的问题上表现不同。例如，RoG 算法在深度为 2 的单位区间问题上表现较好，而分类选择算法在两种长度区间问题上能达到 4 的竞争比。对于含参数 n 的 Isp 问题，随机算法的竞争比为 $\Omega(n)$，这表明该问题对于随机算法来说也具有一定的难度。

我们还可以通过 mermaid 格式流程图来展示不同算法的决策过程。以 RoG 算法为例：

graph TD
    A[区间到达] --> B{与之前区间是否重叠}
    B -- 否 --> C[以 2/3 概率选择]
    B -- 是 --> D[贪心选择]

9. 实际应用中的考虑

在线区间与 t-区间选择问题在很多实际场景中都有应用，如视频点播服务、高速网络和分子生物学等。在实际应用中，我们需要考虑以下几个方面：
- 资源限制 ：实际的资源往往是有限的，例如网络带宽、存储容量等。在设计算法时，需要考虑如何在有限的资源下最大化接受的请求数量。
- 实时性要求 ：在一些应用中，如视频点播服务，需要实时处理请求。因此，算法的时间复杂度也是一个重要的考虑因素。
- 数据的不确定性 ：实际数据可能具有不确定性，例如请求的到达时间和持续时间可能是随机的。在这种情况下，需要设计能够适应不确定性的算法。

10. 总结与展望

本文主要研究了在线区间与 t-区间选择问题，通过堆叠构造技术推导了随机算法的下界，并得到了不同类型问题的竞争比上下界。提出了 RoG 算法，在深度为 2 的单位区间问题上能达到 3/2 的竞争比。

未来的研究方向可以包括：
- 进一步优化算法的竞争比，特别是对于 t > 2 的 t-Isp 问题，寻找更精确的上下界。
- 考虑更多实际应用中的因素，如资源限制、实时性要求和数据的不确定性，设计更实用的算法。
- 研究不同算法在不同场景下的性能，为实际应用提供更准确的指导。

以下是一个总结的要点列表：
1. 堆叠构造技术是推导随机算法下界的有效方法。
2. 不同类型的区间选择问题有不同的竞争比上下界。
3. RoG 算法在特定问题上表现较好。
4. 实际应用中需要考虑资源限制、实时性要求和数据不确定性。
5. 未来研究可从优化竞争比、考虑实际因素和研究算法性能等方面展开。