48、具有广义惩罚的在线函数跟踪

在线函数跟踪算法研究

最新推荐文章于 2025-10-30 09:03:44 发布

c6d7e8f9g

最新推荐文章于 2025-10-30 09:03:44 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：算法世界的探索之旅文章标签：在线函数跟踪 Med算法 Set算法

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/153554143

算法世界的探索之旅专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

具有广义惩罚的在线函数跟踪

1. 引言

在线函数跟踪在众多领域有着广泛的应用。比如在传感器网络中，一个节点会测量某个位置的物理属性（像氧气含量），并需要将这些数据报告给收集多个节点测量值的汇聚节点，以便在必要时发出警报。这里存在通信与能源成本（汇聚节点多久被通知一次）和准确性（汇聚节点获得的信息有多精确）之间的自然权衡。同样的权衡也存在于发布/订阅系统或组织理论中。

本文聚焦于一个双方问题，即一个观察节点将某个函数 (f) 的信息告知跟踪节点。主要目标是为观察节点设计在线算法，确保总体成本（更新成本与不准确惩罚之和）在任何可能的函数变化序列下，都能与提前知晓函数所有值的最优离线算法的成本相竞争。

2. 模型

考虑一个观察者节点想要让跟踪节点了解一个随时间同步变化的函数 (f : Time (N_0) \to Z) 的情况。在每一轮 (t) 中，会发生以下事情：
1. 函数 (f) 可以取一个新的任意值 (f(t) \in Z)。
2. 算法可以以固定更新成本 (C) 将其状态 (Alg_t) 改变为任意整数；否则 (Alg_t = Alg_{t - 1})。
3. 算法支付惩罚 (\Psi(|Alg_t - f(t)|))，其中 (\Psi : N_0 \to N_0) 是一个指定给定不准确成本的通用函数（例如，(\Psi(x) = x)）。

主要目标是找到更新成本（告知跟踪节点新值）和惩罚成本（(f(t)) 与 (Alg_t) 之间的差异）之间的理想权衡：
[Cost = Cost_{update} + Cost_{penalty} = C \cdot \sum_{t = 0}^{T}(Alg_t \neq Alg_{t + 1}) + \sum_{t = 0}^{T} \Psi(Alg_t, f(t))]
其中 (T) 是总轮数（由对手选择）。

假设在时间 (t)，算法只知道 (t’\leq t) 时的函数值 (f(t’))，而对未来的值一无所知。这里采用在线算法和竞争分析，将在线算法 (Alg) 的性能与最优离线算法 (Opt) 进行比较。如果存在常数 (\gamma)，使得对于任何输入 (\sigma)，都有 (Alg(\sigma) \leq \rho \cdot Opt(\sigma) + \gamma)，则称算法是 (\rho) - 竞争的。

3. 相关工作

准确性与更新或传输成本之间的权衡多年来一直困扰着各个领域的研究人员。经典的例子是 TCP 确认问题。在互联网传输协议（如 TCP 协议）的设计中，一个重要问题是接收器向发送器发送确认（ACK）的时间。许多协议采用延迟算法，用单个消息确认多个 ACK 包，主要目标是节省带宽和其他开销，同时保证小延迟。

与 TCP 确认问题相比，本文的模型存在关键差异。这里跟踪的是一个可以随时间增加或减少的任意函数 (f)，而 ACK 的数量在不发送消息时只能增加。

在分布式跟踪领域，协调器试图跟踪分布在多个站点的在线输入，但这些结果在本文的设置中并不适用。与本文最接近的工作是 Yi 和 Zhang 在 SODA 2009 年的论文，他们考虑了更新成本 (C = 1) 和特定惩罚函数的特殊情况。

4. 贡献与文章组织

本文提出了两个在线算法：
- Med 算法 ：对于一大类惩罚函数能实现良好的竞争比。例如，对于凹惩罚函数，它能达到 (O(\log C / \log \log C)) 的比率。对于线性惩罚函数，证明了其竞争比的下限为 (\Omega(\log C / \log \log C))，且该下限对于随机算法也成立。
- Set 算法 ：对于凸惩罚函数是 (O(\log \Delta)) - 竞争的，其中 (\Delta = \min{x : \Psi(x) \geq C})。证明了对于某些凸函数类，这个界限是最优的。

对于多项式惩罚函数 (\Psi(x) = x^{\alpha})，Med 算法是 (O(4^{\alpha} \cdot \log C / \log \log C)) - 竞争的，Set 算法是 (O(\max{1, \frac{1}{\alpha} \cdot \log C})) - 竞争的。通过选择两者中更好的算法，对于所有的 (\alpha)，能得到 (O(\log C / \log \log \log C)) 的竞争比。

5. 算法

所有算法都遵循累积 - 更新范式：等待直到自上次更新以来的总惩罚超过阈值 (\Theta(C))，然后更新值。两个连续更新之间的子序列称为一个阶段。

如果 (f) 单调变化，在阶段结束时将值更新为最后观察到的值的算法是 4 - 竞争的。但在一般情况下，总是更新到最后观察到的值是不好的，因为对手可以利用这种策略。

选择新值可以看作是对最优算法的追求，即算法希望自己的状态尽可能接近最优离线算法 (Opt) 的状态。

5.1 凹惩罚与中位数策略

定义函数的增长：设 (f : N_0 \to N_0) 是一个单调函数且 (f(0) = 0)，(f) 的增长定义为 (\max_{x \geq 1}{f(2x) / f(x)})。例如，任何凹函数的增长至多为 2，(f(x) = c \cdot x^{\alpha}) 的增长为 (2^{\alpha})。

还存在三角不等式：设 (\Psi) 是增长至多为 (\beta) 的惩罚函数，对于任意三个整数 (a)、(b) 和 (c)，有 (\Psi(a, c) \leq \beta \cdot (\Psi(a, b) + \Psi(b, c)))。

Med 算法基于中位数策略，将输入序列划分为阶段。如果在某一轮 (t)，函数 (f(t)) 突然变化且与 (Med_{t - 1}) 相差很远，即 (\Psi(Med_{t - 1}, f(t)) > C)，则 (Med_t := f(t))。否则，如果到当前轮的累积差异之和超过或等于 (C)，则 (Med_t) 设为该阶段函数值的中位数。

以下是关于 Med 算法的几个引理和定理：
- 引理 1 ：假设惩罚函数的增长受 (\beta) 限制，考虑一个阶段 (P)，则 (Med(\sigma_P) \leq 2 \cdot (\beta + 1) \cdot C)。
- 引理 2 ：假设惩罚函数的增长至多为 (\beta)，对于一个 (\alpha) - 受限阶段 (P)，有 (\Psi(Med_{t_1}, \xi) \leq 2C) 且 (\frac{\Psi(Med_{t_1}, \xi)}{\Psi(Med_{t_0}, \xi)} \leq \frac{2 \cdot \alpha}{C / \beta - \alpha})。
- 引理 3 ：假设惩罚函数的增长至多为 (\beta)，存在 (\ell = \Theta(\log C / \log \log C))，使得在任何由连续 (2\ell + 1) 个阶段组成的子序列 (\tau) 中，(Opt(\tau) = \Omega(C / \beta))。
- 定理 3 ：Med 算法对于增长至多为 (\beta) 的惩罚函数 (\Psi) 是 (O(\beta^2 \cdot \log C / \log \log C)) - 竞争的。

下面是算法执行流程的 mermaid 流程图：

graph TD;
    A[开始阶段] --> B{Ψ(Medt−1, f(t)) > C?};
    B -- 是 --> C[Medt := f(t)];
    B -- 否 --> D{累积差异之和 ≥ C?};
    D -- 是 --> E[Medt := 阶段函数值中位数];
    D -- 否 --> F[继续监测];
    C --> G[阶段结束，开始新阶段];
    E --> G;
    F --> B;

总结一下 Med 算法的步骤：
1. 划分输入序列为阶段。
2. 每个阶段开始时，监测总惩罚。
3. 检查函数值变化和累积差异，根据条件更新 (Med_t)。
4. 当 (Med) 状态改变时，结束当前阶段，开始新阶段。

通过这些步骤和分析，Med 算法在凹惩罚函数和有界增长函数的情况下能取得较好的性能。

具有广义惩罚的在线函数跟踪

6. 凸惩罚与 Set 算法

对于凸惩罚函数，提出了 Set 算法。Set 算法也是基于累积 - 更新范式，不过它采用了与 Med 算法不同的策略。

Set 算法主要关注一个集合，这个集合中的状态使得算法支付的代价较小，这些状态是最优算法 (Opt) 可能处于的潜在候选状态。通过选择处于这个集合中间的位置，在每个阶段，集合的基数会以一个常数因子减小。

Set 算法对于凸惩罚函数是 (O(\log \Delta)) - 竞争的，其中 (\Delta = \min{x : \Psi(x) \geq C})。这是对之前相关工作中界限的一个推广，之前的工作中 (\Psi) 只能取 ({0, \infty}) 中的值。并且证明了对于某些类别的凸函数，这个界限是最优的，即使对于随机算法也是如此。

Set 算法的步骤如下：
1. 开始一个阶段，初始化相关集合。
2. 持续监测总惩罚，当总惩罚超过阈值 (\Theta(C)) 时，进入下一步。
3. 确定集合中的中间位置，更新算法状态到该位置。
4. 结束当前阶段，开始新阶段。

以下是 Set 算法执行流程的 mermaid 流程图：

graph TD;
    A[开始阶段] --> B[初始化集合];
    B --> C{总惩罚 > Θ(C)?};
    C -- 是 --> D[确定集合中间位置];
    C -- 否 --> E[继续监测];
    D --> F[更新状态到中间位置];
    F --> G[阶段结束，开始新阶段];
    E --> C;

7. 多项式惩罚函数的性能分析

对于多项式惩罚函数 (\Psi(x) = x^{\alpha})，Med 算法和 Set 算法都有各自的竞争比表现。

Med 算法是 (O(4^{\alpha} \cdot \log C / \log \log C)) - 竞争的，Set 算法是 (O(\max{1, \frac{1}{\alpha} \cdot \log C})) - 竞争的。通过比较这两个算法的竞争比，选择其中更好的算法，对于所有的 (\alpha)，能得到 (O(\log C / \log \log \log C)) 的竞争比。

下面通过一个表格来对比不同算法在多项式惩罚函数下的竞争比：
| 算法 | 竞争比 |
| ---- | ---- |
| Med 算法 | (O(4^{\alpha} \cdot \log C / \log \log C)) |
| Set 算法 | (O(\max{1, \frac{1}{\alpha} \cdot \log C})) |
| 最优选择 | (O(\log C / \log \log \log C)) |