87、单调布尔函数影响力近似计算的研究

最新推荐文章于 2025-10-20 01:05:02 发布

seed

最新推荐文章于 2025-10-20 01:05:02 发布

阅读量31

点赞数

CC 4.0 BY-SA版权

分类专栏：近似与随机算法前沿文章标签：单调布尔函数影响力近似计算

本文链接：https://blog.youkuaiyun.com/seed/article/details/153600577

近似与随机算法前沿专栏收录该内容

90 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

单调布尔函数影响力近似计算的研究

1. 预备知识

函数影响力的定义 ：函数的影响力可以定义为其所有变量个体影响力之和。等价地，函数 (f) 的影响力是随机输入 (x \in {0, 1}^n) 时敏感坐标的期望数量（即那些使得 (f(x) \neq f(x(\oplus i))) 的坐标 (i)）。
影响力与双色边的关系 ：可以将函数 (f) 看作布尔格的一种二着色。此时，任何“双色”边（即满足 (f(x) \neq f(x(\oplus i))) 的边 ((x, x(\oplus i)))）被称为有影响力的边。布尔函数 (f) 的有影响力的边的数量为 (2^{n - 1} \cdot I[f])。
布尔格的偏序关系和单调函数 ：在 (n) 维布尔格上定义了标准偏序关系“(\prec)”。对于 (x = (x_1, \ldots, x_n))，(y = (y_1, \ldots, y_n) \in {0, 1}^n)，(x \prec y) 表示对于每个 (1 \leq i \leq n) 有 (x_i \leq y_i)，且存在某个 (1 \leq i \leq n) 使得 (x_i < y_i)。如果对于所有 (x \prec y) 都有 (f(x) \leq f(y))，则布尔函数 (f: {0, 1}^n \to {0, 1}) 是单调的。一个著名的等周不等式表明，任何单调布尔函数都满足 (I[f] = O(\sqrt{n}))，对于多数函数，这个界是紧的。
研究对象 ：主要研究具有至少恒定影响力（即 (I[f] \geq c)，其中 (c \geq 0)）的单调布尔函数，因为当函数具有一定的敏感性时，所研究的计算问题更自然。函数的影响力下界为 (4 \cdot Pr[f(x) = 1] \cdot Pr[f(x) = 0])，所以分析尤其适用于不太有偏差（相对平衡）的函数。
符号说明 ：使用符号 (f(n) = \tilde{O}(g(n))) 表示 (f(n) = O(g(n) \text{polylog}(g(n))))；类似地，(f(n) = \tilde{\Omega}(g(n))) 表示 (f(n) = \Omega(g(n) / \text{polylog}(g(n))))。

2. 算法介绍

直接采样方法 ：可以通过均匀采样 (\Theta(\frac{n}{I[f]} \cdot \epsilon^{-2})) 对 ((x, x(\oplus i)))（布尔格中的边），对这些对查询函数值，并考虑样本中有影响力的边的比例，以高恒定概率得到影响力的 ((1 \pm \epsilon)) 因子估计。但我们追求复杂度为 (\frac{\sqrt{n}}{I[f]} \cdot \text{poly}(1 / \epsilon)) 的算法，所以采用不同方法。假设 (\epsilon \geq c \sqrt{\frac{\log n}{n}})（(c) 为足够大的常数），当 (\epsilon) 较小时，(\frac{n}{I[f]} \cdot \epsilon^{-2}) 上界为 (\frac{\sqrt{n}}{I[f]} \cdot \text{poly}(1 / \epsilon))，此时可采用直接采样方法。
算法步骤

算法 1: 近似计算影响力（给定 \(\epsilon\)，\(\delta\) 和对 \(f\) 的神谕访问）
1. 设置 \(\tilde{\epsilon} = \epsilon / 4\)，\(w = \frac{\tilde{\epsilon} \sqrt{n}}{16 \sqrt{2 \log(\frac{2n}{\tilde{\epsilon}})}}\)，\(s^* = \frac{1}{2} \sqrt{2n \log(\frac{2n}{\tilde{\epsilon}})}\)，\(t = \frac{96 \ln(\frac{2}{\delta})}{\epsilon^2}\)。
2. 初始化 \(\alpha \leftarrow 0\)，\(m \leftarrow 0\)，\(\hat{I} \leftarrow 0\)。
3. 重复以下操作直到 \(\alpha = t\)：
    (a) 从均匀选择的点 \(v\) 开始，在 \(\{0, 1\}^n\) 格上进行长度为 \(w\) 的随机游走，在 \(n/2 - s^* - 1\) 处截断，令 \(u\) 为游走的终点。
    (b) 如果 \(f(u) \neq f(v)\)，则 \(\alpha \leftarrow \alpha + 1\)。
    (c) \(m \leftarrow m + 1\)
4. \(\hat{I} \leftarrow \frac{n}{w} \cdot \frac{t}{m}\)
5. 返回 \(\hat{I}\)。

算法思路 ：考虑满足 (v \succ u) 且在格上 (v) 到 (u) 有长度约为 (\epsilon \sqrt{n}) 的路径的对 ((v, u))。由于函数 (f) 是单调的，如果从 (v) 到 (u) 的路径包含有影响力的边，则 (f(v) \neq f(u))，且任何这样的路径最多包含一条有影响力的边。通过考虑更长的路径来提高检测有影响力的边的概率，并且算法只查询路径的端点，不考虑路径长度。
参数说明 ：(m) 是随机变量，表示进行的游走次数，算法持续进行新的游走直到“成功”游走（即经过有影响力的边的游走）的数量达到阈值 (t)。这样做是为了避免需要知道 (f) 影响力的下界，使得算法更简单。为简化分析，假设 (I[f] \geq 1)，这个假设可以通过适当修改算法参数轻松替换为 (I[f] \geq c)（(c > 0) 为常数）甚至 (I[f] \geq n^{-c})。

3. 算法分析

定理 1 ：对于每个单调函数 (f: {0, 1}^n \to {0, 1}) 且 (I[f] \geq 1)，对于每个 (\delta > 0) 和 (\epsilon = \omega(\sqrt{\frac{\log n}{n}}))，算法 1 的输出 (\hat{I}) 以至少 (1 - \delta) 的概率满足 ((1 - \epsilon) \cdot I[f] \leq \hat{I} \leq (1 + \epsilon) \cdot I[f])。并且，以至少 (1 - \delta) 的概率，算法执行的查询次数为 (O(\frac{\log(1 / \delta)}{\epsilon^3} \cdot \frac{\sqrt{n} \log(n / \epsilon)}{I[f]}))。这也意味着算法的期望查询复杂度为 (O(\frac{\log(1 / \delta)}{\epsilon^3} \cdot \frac{\sqrt{n} \log(n / \epsilon)}{I[f]}))，且算法执行的查询次数超过期望次数 (k) 倍的概率随 (k) 指数下降。
关键定义 ：定义 (p_{w, s^ }(f)) 为从均匀选择的点开始，在布尔格上进行长度为 (w) 的随机游走，在 (n/2 - s^ - 1) 处截断，从 (f(v) = 1) 开始并到达 (f(u) = 0) 的概率。
引理 1 ：设 (f) 满足 (I[f] \geq 1)，(\epsilon > 0) 满足 (\epsilon > \frac{8 \sqrt{2 \log(\frac{8n}{\epsilon})}}{\sqrt{n}})，记 (\tilde{\epsilon} = \epsilon / 4)。对于任何 (w \leq \frac{\tilde{\epsilon} \sqrt{n}}{16 \sqrt{2 \log(\frac{2n}{\tilde{\epsilon} I[f]})}}) 和 (s^ = \frac{1}{2} \sqrt{n} \sqrt{2 \log(\frac{2n}{\tilde{\epsilon}})})，有 ((1 - \epsilon / 2) \cdot \frac{w}{n} \cdot I[f] \leq p_{w, s^ }(f) \leq (1 + \epsilon / 2) \cdot \frac{w}{n} \cdot I[f])。
- 证明思路 ：通过分析有影响力的边的分布，考虑随机游走经过有影响力的边的概率。对于不同层次的有影响力的边，分别推导其被随机游走经过的概率上下界，最后根据单调函数的性质（每个随机游走最多经过一条有影响力的边），对所有有影响力的边的概率求和得到 (p_{w, s^*}(f)) 的上下界。

下面是算法执行流程的 mermaid 流程图：

graph TD;
    A[开始] --> B[设置参数];
    B --> C[初始化变量];
    C --> D{α = t?};
    D -- 否 --> E[进行随机游走];
    E --> F{f(u) ≠ f(v)?};
    F -- 是 --> G[α = α + 1];
    F -- 否 --> H[无操作];
    G --> I[m = m + 1];
    H --> I;
    I --> D;
    D -- 是 --> J[计算 ˆI];
    J --> K[返回 ˆI];
    K --> L[结束];

通过上述算法和分析，我们可以在满足一定条件下，以较低的查询复杂度近似计算单调布尔函数的影响力。接下来，我们将探讨该算法的下界情况。

单调布尔函数影响力近似计算的研究

4. 下界证明

单调函数查询复杂度下界 ：在这部分，我们将证明近似计算单调函数影响力的查询复杂度存在一个下界 (\Omega(\frac{\sqrt{n}}{I[f] \cdot \log n}))。同时，会解释相关构造如何给一般函数影响力近似计算带来 (\Omega(\frac{n}{I[f]})) 的下界。
- 构造思路 ：我们要证明任何执行 (o(\frac{\sqrt{n}}{I[f] \cdot \log n})) 次查询的算法，都无法以恒定成功概率区分以下两种情况：
  - 一个特定的阈值函数（作用于相对较少的变量）。
  - 从某个函数族中均匀随机选择的函数，这个函数族的函数影响力显著高于阈值函数，可看作“将影响力隐藏在阈值函数之后”。
- 阈值函数的定义与性质 ：对于任意整数 (1 \leq k \leq n) 和 (0 \leq t \leq k)，定义 (t -) 阈值函数 (\tau_{k}^{t}: {0, 1}^n \to {0, 1})，当且仅当 (\sum_{i = 1}^{k} x_i \geq t) 时，(\tau_{k}^{t}(x) = 1)。其影响力 (I[\tau_{k}^{t}]=k \cdot 2^{-(k - 1)} \cdot \binom{k - 1}{t - 1})。对于足够大的 (k)（(k \geq 2 \log n) 即可），存在一个 (t < k / 2)（记为 (t(k, 1))），使得 (I[\tau_{k}^{t(k, 1)}]=1 - o(1))（这里 (o(1)) 是关于 (k) 的无穷小），且 (\binom{k - 1}{t(k, 1) - 1}=\Theta(2^{k}/k))，所以 (t(k, 1)=k / 2-\Theta(\sqrt{k \log k}))。
- 定理 2 ：对于每个 (2 \leq I^ \leq \sqrt{n}/\log n)，存在一个单调函数族 (F_{I^ })，使得对于每个 (f \in F_{I^ }) 都有 (I[f] \geq I^ )。但任何以至少 (\frac{2}{3}) 的概率区分从 (F_{I^ }) 中均匀选择的函数和 (\tau_{k}^{t(k, 1)})（其中 (k = 2 \log n)）的算法，必须执行 (\Omega(\frac{\sqrt{n}}{I^ \cdot \log n})) 次查询。特别地，当 (I^* = c)（(c \geq 2) 为常数）时，任何将影响力近似到 (\sqrt{c}) 倍乘法因子的算法必须执行 (\tilde{\Omega}(\sqrt{n})) 次查询。随着影响力下界的增加，算法复杂度的下界会降低，但下界适用的近似因子会增加。需要注意的是，这里给出的下界仅适用于具有（至少）恒定影响力的函数。当 (I[f] = 1 / \text{poly}(n)) 时，算法在查询复杂度方面的紧性无法保证。

下面通过表格总结不同情况下的下界信息：
| 函数类型 | 影响力范围 | 近似计算的查询复杂度下界 |
| ---- | ---- | ---- |
| 单调函数 | (2 \leq I^ \leq \sqrt{n}/\log n) | (\Omega(\frac{\sqrt{n}}{I^ \cdot \log n})) |
| 单调函数（(I^* = c)，(c \geq 2) 为常数） | - | (\tilde{\Omega}(\sqrt{n})) |
| 一般函数 | - | (\Omega(\frac{n}{I[f]})) |

5. 总结

通过以上的研究，我们对单调布尔函数影响力的近似计算有了较为深入的认识：
- 算法优势 ：提出的算法在满足一定条件（(\epsilon \geq c \sqrt{\frac{\log n}{n}})）下，能够以较低的查询复杂度 (O(\frac{\log(1 / \delta)}{\epsilon^3} \cdot \frac{\sqrt{n} \log(n / \epsilon)}{I[f]})) 近似计算单调布尔函数的影响力。该算法通过考虑更长的路径来提高检测有影响力边的概率，且只查询路径端点，避免了因路径长度带来的额外开销。
- 下界限制 ：证明了近似计算单调函数影响力的查询复杂度存在下界 (\Omega(\frac{\sqrt{n}}{I[f] \cdot \log n}))，这为算法的设计和优化提供了理论依据。同时，相关构造也为一般函数影响力近似计算给出了 (\Omega(\frac{n}{I[f]})) 的下界。

未来的研究可以在以下方向展开：
- 算法优化 ：尝试进一步降低查询复杂度，或者放宽算法适用的条件，使其能处理更广泛的函数类型和参数范围。
- 下界拓展 ：探索是否存在更严格的下界，或者研究在不同场景下（如非均匀分布的输入）函数影响力近似计算的下界情况。

总的来说，单调布尔函数影响力的近似计算是一个具有重要理论和实际意义的问题，本文的研究成果为后续的研究和应用奠定了基础。