在线区间与 t-区间选择问题研究
1. 引言
区间调度是一种资源分配问题,机器作为资源。在过去几十年里,运营管理从资源导向的物流(资源可用性决定作业规划和完成)转变为需求导向的物流(作业及其完成基本固定,需寻找合适资源),这意味着从传统调度向区间调度转变。
假设在线运营一个资源,客户不时请求使用,时长最多为 t 个时间段,且时间段长度不一定相同。这些请求要么被接受,要么被拒绝。若接受请求,资源将在相应时间段被占用;若请求的时间段与已接受请求的时间段有交集,则该请求不能被接受。目标是尽可能多地接受请求。
这可以建模为在线 t-区间选择(t-Isp)问题。t 表示任何请求涉及的最大时间段数,每个请求用一个 t-区间表示,即实线上最多 t 个半开区间(称为段)的并集。t-区间逐个到达,需在单台机器上进行非抢占式调度。两个 t-区间 I 和 J 不相交,当且仅当它们的段都不相交;若一个段与另一个段相交,则它们相交。t-区间到达时,调度器需决定是否接受,若不接受则永远失去该请求。目标是选择一个不相交 t-区间的子集(即“形成一个调度”),使其基数最大。当 t = 1 时,该问题称为在线区间选择问题(Isp)。
在线算法的性能用竞争比衡量。形式上,设 OPT 是该问题的最优离线算法,算法 A 的竞争比定义为 $\sup_{\sigma} \frac{OPT(\sigma)}{A(\sigma)}$,其中 $\sigma$ 是输入序列,$OPT(\sigma)$ 和 $A(\sigma)$ 分别是 OPT 和 A 选择的 t-区间数量。对于随机算法,用期望 $E[A(\sigma)]$ 代替 $A(\sigma)$,竞争比定义为 $\rho_A = \sup_{\sigma} \frac{OPT(\sigma)}{E[A(\sigma)]}$。竞争比至多为 $\rho$ 的算法称为 $\rho$-竞争算法。设 n 是实例中的区间数量,$\Delta$ 表示最长和最短段长度的比率。
2. 相关工作
- 区间和 t-区间选择 :t-Isp 可视为在 t-区间图中寻找最大独立集(IS)的问题。对于区间图的特殊情况,该问题可多项式求解;但当 t = 2 时,IS 问题变为 APX 难问题。有文献提出了离线加权 tISP 的 2t-近似算法,后续工作扩展到带需求的 t-区间选择以及 t-区间图上其他优化问题的研究。
- 在线区间选择 :Lipton 和 Tomkins 考虑了一个在线区间选择问题,其中区间的权重与其长度成比例,且区间按时间(即左端点顺序)到达。他们表明,当 $\Delta$ 已知时,$\theta(\log \Delta)$ 竞争因子是最优的;当 $\Delta$ 未知时,引入了一种技术可得到 $O(\log^{1 + \epsilon} \Delta)$ 竞争因子。Woeginger 考虑了加权 Isp 的抢占式版本,并给出了最优的 4-竞争算法。Kierstead 和 Trotter 给出了一个 3-竞争算法用于最小化机器数量的区间调度问题。t-Isp 问题与 JISP 问题有相似之处,但在 JISP 中,只需选择作业的一个可能段即可。
- 呼叫准入 :Isp 可视为在线上的呼叫准入问题,目标是最大化接受的呼叫数量。有文献提出了一个强 $\lceil\log N\rceil$-竞争算法,当 $\Delta$ 已知时,可得到一般 Isp 实例的 $O(\log \Delta)$ 竞争算法。
3. 研究结果
我们首次推导了在线 t-Isp 算法竞争比的上下界,以及 Isp 的新的或改进的界。以下是不同类型实例的随机算法竞争比结果总结:
| 问题类型 | Isp(上界) | Isp(下界) | 2-Isp(上界) | 2-Isp(下界) | t-Isp(上界) | t-Isp(下界) |
| — | — | — | — | — | — | — |
| 一般输入 | $O(\log^{1 + \epsilon} \Delta)$ | $\Omega(\log \Delta)$ | $O(\log^{2 + \epsilon} \Delta)$ | $\Omega(\log \Delta)$ | - | - |
| 两种长度 | 4 | 4 | 16 | 6 | - | - |
| 单位长度 | 2 | 2 | 4 | 3 | 2t | $\Omega(t)$ |
| 有界深度 s | 3/2 (s = 2) | 2 - 1/s | - | - | - | - |
4. 堆叠构造技术
在推导随机算法的(t-)区间选择问题的下界时,使用堆叠构造技术。对手可以利用能预见算法选择任何给定动作的概率这一事实,将区间堆叠起来,直到某个区间被选择的概率足够低,然后利用这一点迫使算法得到不理想的结果。
设 R 是一个 Isp 算法,给定参数 q 和 x。一个 (q, x)-堆叠构造如下:形成 q 个单位区间 $I_1, \ldots, I_q$,它们相互重叠,左端点向左间隔 $x/q$。即 $I_i = [x(1 - i/q), 1 + x(1 - i/q))$,$i = 1, \ldots, q$。设 $p_i$ 是 R 选择 $I_i$ 的(无条件)概率,对手知道 $p_i$ 的值并据此构造输入序列。设 m 是使得 $p_m \leq 1/q$ 的最小的值,输入序列构造为 $\langle I_1, I_2, \ldots, I_m, J_m\rangle$,其中 $J_m = [1 + x(1 - m/q), 2 + x(1 - m/q))$。
一个 (q, x)-堆叠构造 I 具有以下性质:
1. I 中除 $I_m$ 外的所有区间都与段 $[1, 1 + x)$ 重叠。
2. I 中的所有区间都包含在区间 $[0, 2 + x)$ 内。
3. I 中除 $I_m$ 外的区间有一个长度为 $x/q$ 的公共交集,由段 $X = I_{m - 1} \cap J_m = [1 + x(1 - m/q), 1 + x(1 - (m - 1)/q))$ 给出。
4. $E_R[I_m] = p_m \leq 1/q$,因此 $E_R[I] \leq 1 + 1/q$。
5. $OPT(I) = 2$,因此 R 的性能比至少为 $2/(1 + 1/q)$。
通过取 q 任意大,可得到任何随机在线单位区间 Isp 算法的竞争比至少为 2。
5. 在线区间选择
5.1 单位区间与深度
对于 Isp 的单位区间问题,我们给出竞争比的上下界,问题以区间系统的深度(即重叠公共点的最大区间数)为参数。
任何随机在线单位区间 Isp 算法的竞争比至少为 $2 - 1/s$,其中 s 是实例的深度。证明过程是对 (s, 1)-堆叠构造进行修改,根据算法选择区间的概率进行不同处理,以得到期望的竞争比。
对于 s = 2 的情况,提出 RoG(随机或贪心)算法,该算法处理到达的区间如下:若区间与之前的区间不重叠,以 2/3 的概率选择;否则,贪心选择。该算法对于深度为 2 的单位区间是 3/2-竞争的。证明过程基于实例的深度限制,将区间分为三种类型,计算算法选择区间的期望数量和最优解的数量,从而得到竞争比。
5.2 两种长度的区间
对于 Isp 实例,当区间有两种不同长度 1 和 d 时,通过经典的分类选择方法(抛硬币选择单位区间或长度为 d 的区间,然后仅贪心添加该长度的区间)可得到一个 4-竞争算法。并且,任何随机在线具有两种长度区间的 Isp 算法的性能比渐近至少为 4。
5.3 含参数 n 的 Isp
Isp 对于无区间大小约束的实例,确定性算法较难处理。随机算法对于无约束实例也有线性下界。任何随机在线 Isp 算法的竞争比为 $\Omega(n)$。证明过程通过构造一个区间序列,将区间分为“好”区间和“坏”区间,计算算法接受区间的期望数量和最优解的期望数量,从而得到竞争比。
6. 在线 2-区间选择
对于单位段的 2-Isp 问题,任何随机在线算法的竞争比至少为 3。证明过程通过构造 2-区间 (q’, 1)-堆叠构造,根据算法选择区间的概率进行不同处理,若概率小于 2/3 则停止构造,若概率大于等于 2/3 则继续构造更多堆叠,最终得到竞争比至少为 3 的结论。
mermaid 格式流程图如下:
graph TD
A[开始] --> B[构造 2-区间 (q', 1)-堆叠构造 I]
B --> C{ER[Im] ≤ 1/q'}
C -- 是 --> D{选择 I' 中区间概率 p < 2/3}
D -- 是 --> E[停止构造,计算竞争比]
D -- 否 --> F[形成 (q, x)-堆叠构造 I1 和 I2]
C -- 否 --> F
F --> G[完成构造,分析竞争比]
以下是总结的关键结论列表:
1. 在线区间与 t-区间选择问题在资源分配中有重要应用,从传统调度向区间调度转变体现了其实际意义。
2. 通过堆叠构造技术可推导随机算法的下界。
3. 对于不同类型的区间选择问题(单位区间、两种长度区间、含参数 n 的区间、2-区间等),得到了相应的竞争比上下界。
4. 提出了 RoG 算法,在特定条件下能达到较好的竞争比。
在线区间与 t-区间选择问题研究
7. 在线 t-区间选择的进一步分析
在前面我们已经对在线 Isp 和 2-Isp 问题进行了较为详细的探讨,接下来我们将对更一般的 t-Isp 问题进行分析。虽然目前对于 t > 2 的 t-Isp 问题,我们还没有得到像 Isp 和 2-Isp 那样全面的结果,但可以基于已有的方法进行一些思考和推测。
从堆叠构造技术来看,我们可以尝试将其扩展到 t-Isp 问题。对于 t 个半开区间组成的 t-区间,我们可以在每个半开区间上分别进行堆叠构造。例如,对于一个 t-区间,我们可以在其每个段上都进行类似 (q, x)-堆叠构造的操作。不过,随着 t 的增大,问题的复杂度会显著增加,因为需要考虑更多段之间的相互关系。
在竞争比方面,我们已经知道对于单位长度的 t-Isp 问题,上界为 2t,下界为 $\Omega(t)$。这表明随着 t 的增大,算法的性能会逐渐变差。我们可以推测,对于更一般的 t-Isp 问题,竞争比可能会与 t 和 $\Delta$ 都有关系。例如,对于一般输入的 t-Isp 问题,竞争比可能会是关于 $\log \Delta$ 和 t 的一个函数。
8. 算法性能对比与分析
为了更直观地了解不同算法在不同问题上的性能,我们可以对前面提到的算法进行对比分析。以下是一个对比表格:
| 问题类型 | 算法 | 竞争比 |
| — | — | — |
| 单位区间(深度 s = 2) | RoG | 3/2 |
| 两种长度区间 | 分类选择 | 4 |
| 含参数 n 的 Isp | - | $\Omega(n)$ |
| 单位段 2-Isp | - | 3 |
从这个表格中我们可以看出,不同的算法在不同的问题上表现不同。例如,RoG 算法在深度为 2 的单位区间问题上表现较好,而分类选择算法在两种长度区间问题上能达到 4 的竞争比。对于含参数 n 的 Isp 问题,随机算法的竞争比为 $\Omega(n)$,这表明该问题对于随机算法来说也具有一定的难度。
我们还可以通过 mermaid 格式流程图来展示不同算法的决策过程。以 RoG 算法为例:
graph TD
A[区间到达] --> B{与之前区间是否重叠}
B -- 否 --> C[以 2/3 概率选择]
B -- 是 --> D[贪心选择]
9. 实际应用中的考虑
在线区间与 t-区间选择问题在很多实际场景中都有应用,如视频点播服务、高速网络和分子生物学等。在实际应用中,我们需要考虑以下几个方面:
-
资源限制
:实际的资源往往是有限的,例如网络带宽、存储容量等。在设计算法时,需要考虑如何在有限的资源下最大化接受的请求数量。
-
实时性要求
:在一些应用中,如视频点播服务,需要实时处理请求。因此,算法的时间复杂度也是一个重要的考虑因素。
-
数据的不确定性
:实际数据可能具有不确定性,例如请求的到达时间和持续时间可能是随机的。在这种情况下,需要设计能够适应不确定性的算法。
10. 总结与展望
本文主要研究了在线区间与 t-区间选择问题,通过堆叠构造技术推导了随机算法的下界,并得到了不同类型问题的竞争比上下界。提出了 RoG 算法,在深度为 2 的单位区间问题上能达到 3/2 的竞争比。
未来的研究方向可以包括:
- 进一步优化算法的竞争比,特别是对于 t > 2 的 t-Isp 问题,寻找更精确的上下界。
- 考虑更多实际应用中的因素,如资源限制、实时性要求和数据的不确定性,设计更实用的算法。
- 研究不同算法在不同场景下的性能,为实际应用提供更准确的指导。
以下是一个总结的要点列表:
1. 堆叠构造技术是推导随机算法下界的有效方法。
2. 不同类型的区间选择问题有不同的竞争比上下界。
3. RoG 算法在特定问题上表现较好。
4. 实际应用中需要考虑资源限制、实时性要求和数据不确定性。
5. 未来研究可从优化竞争比、考虑实际因素和研究算法性能等方面展开。
超级会员免费看
2307

被折叠的 条评论
为什么被折叠?



