63、布尔函数性质测试及随机图独立集的研究-优快云博客

本文链接：https://blog.youkuaiyun.com/seed/article/details/153600482

布尔函数性质测试及随机图独立集的研究

1. 布尔函数性质测试相关概念

1.1 独立测试器

独立测试器是一种概率预言机，用于测试布尔函数是否属于某个特定类 (C)。具体来说，一个 (q(\epsilon)) - 查询独立测试器 (T = (T_1, T_2)) 有以下特点：
- 查询生成阶段（(T_1)） ：
- 输入距离参数 (\epsilon) 和一个黑盒预言机，用于访问任意函数 (f: {0, 1}^n \to {0, 1})。
- 为选择第 (i) 个查询字符串，将集合 ([n]) 划分为 (2^{i - 1}) 个块。块 (B_{b_1, \cdots, b_{i - 1}}) 包含那些在第 (j) 个查询字符串 (x_j) 中第 (j) 位被设置为 (b_j) 的索引，其中 (j = 1, \cdots, i - 1)。
- 对于每个块 (B_{b_1, \cdots, b_{i - 1}}) 中的每个 (m)，算法以概率 (p_{b_1, \cdots, b_i}) 将 (x_i^m) 设置为 1，以概率 (1 - p_{b_1, \cdots, b_i}) 设置为 0。
- 选择完所有字符串后，查询所有 (q(\epsilon)) 个字符串 (x_1, \cdots, x_{q(\epsilon)}) 并获取响应 (f(x_1), \cdots, f(x_{q(\epsilon)}))。
- 计算阶段（(T_2)） ：
- 输入 (q(\epsilon)) 个查询 - 答案对 ((x_1, f(x_1)), \cdots, (x_{q(\epsilon)}, f(x_{q(\epsilon)})))。
- 进行确定性计算，输出“接受”或“拒绝”。

独立测试器的查询生成算法 (T_1) 需满足以下条件：
- 对于每个字符串 (b = (b_1, \cdots, b_t))，概率 (p_b = p_b(\epsilon)) 是一个 (0 \leq p_b \leq 1) 的值，可能依赖于 (\epsilon) 但与 (n) 无关。
- 对于每个 (t)，(2^t) 个值 (p_{b_1, \cdots, b_t})（(b) 遍历 ({0, 1}^t)）都是有理数，且所有这些有理数的分母最多为 (c = c(\epsilon))（(c) 可能依赖于 (\epsilon) 但与 (n) 无关），称 (c(\epsilon)) 为独立测试器 (T) 的粒度。

根据测试器的类型，有不同的成功标准：
- 单边测试器 ：对于任何 (f: {0, 1}^n \to {0, 1})，如果 (f) 属于 (C)，则 (Pr[T^f = \text{“接受”}] = 1)；如果 (f) 与 (C) 的距离为 (\epsilon)，则 (Pr[T^f = \text{“拒绝”}] \geq r(\epsilon))，其中 (r(\epsilon) > 0) 是仅关于 (\epsilon) 的正函数，称 (r(\epsilon)) 为测试器的拒绝参数。
- 双边测试器 ：对于任何 (f: {0, 1}^n \to {0, 1})，如果 (f) 属于 (C)，则 (Pr[T^f = \text{“接受”}] = 1 - a(\epsilon))；如果 (f) 与 (C) 的距离为 (\epsilon)，则 (Pr[T^f = \text{“拒绝”}] \geq r(\epsilon))，其中 (a) 和 (r) 是仅关于 (\epsilon) 的函数，且对于 (0 < \epsilon < 1/2)，(a(\epsilon) < r(\epsilon))，称 (a(\epsilon)) 和 (r(\epsilon)) 分别为测试器的接受和拒绝参数。

1.2 规范测试器

规范测试器是另一种用于测试布尔函数的概率预言机。一个 (q’) - 规范测试器 (T = (T_1, T_2)) 的工作方式如下：
- 查询生成阶段（(T_1)） ：
- 输入距离参数 (\epsilon) 和一个黑盒预言机，用于访问任意函数 (f: {0, 1}^n \to {0, 1})。
- 选择 (z_1, \cdots, z_{q’(\epsilon)}) 为独立均匀随机的 (n) 位字符串，这些字符串将 ([n]) 划分为 (2^{q’(\epsilon)}) 个块：元素 (i \in [n]) 位于块 (B_{b_1, \cdots, b_{q’(\epsilon)}}) 中，如果字符串 (z_j) 的第 (i) 位等于 (b_j)，对于所有 (j = 1, \cdots, q’(\epsilon))。
- 定义 (Q_B \subseteq {0, 1}^n) 为所有满足以下条件的字符串 (x) 的集合：对于所有 (i, j \in [n])，如果 (i) 和 (j) 在同一个分区子集 (B_{b_1, \cdots, b_{q’(\epsilon)}} \in B) 中，则 (x_i = x_j)。
- 使用 (f) 的预言机，查询所有 (2^{2^{q’(\epsilon)}}) 个字符串 (x \in Q_B)。
- 计算阶段（(T_2)） ：
- 输入 (2^{2^{q’(\epsilon)}}) 个查询 - 答案对 ([(x, f(x))]_{x \in Q_B})。
- 进行确定性计算，输出“接受”或“拒绝”。

规范测试器的单边和双边成功标准与独立测试器类似。

1.3 主要结果

主要结果表明：
- 任何在 Noisy - Neg 子式下封闭且可由双边独立测试器进行常数查询测试的类，也可由双边规范测试器进行常数查询测试。
- 任何在 ID - Neg 子式下封闭且可由单边独立测试器进行常数查询测试的类，也可由单边规范测试器进行常数查询测试。

具体定理如下：
- 定理 3 ：设 (C) 是任何在 Noisy - Neg 子式下封闭的函数类，(T) 是具有接受和拒绝参数 (a(\epsilon)) 和 (r(\epsilon)) 的 (q(\epsilon)) - 查询独立测试器。设 (q’ 2(\epsilon)) 是满足以下边界的最小整数值：
[NS {\frac{Prod(\epsilon)}{2}} \cdot \frac{1}{2^{q’ 2(\epsilon)}}(C) \leq \frac{r(\epsilon) - a(\epsilon)}{16q(\epsilon)}]
设 (\eta’ = \frac{2^{q’_2(\epsilon)} \bmod Prod(\epsilon)}{2^{q’_2(\epsilon)}})，(q’_1(\epsilon) = \left\lceil 32 \frac{NS {\eta’}(C)}{\ln \frac{8}{r(\epsilon) - a(\epsilon)}} \right\rceil)，(q’(\epsilon) = q’_2(\epsilon) \cdot (q’_1(\epsilon) + 1))。则存在一个 (q’) - 规范测试器 (Canon(T)) 用于 (C)，其接受和拒绝参数分别为 (a’(\epsilon) = \frac{3}{4}a(\epsilon) + \frac{1}{4}r(\epsilon)) 和 (r’(\epsilon) = \frac{1}{4}a(\epsilon) + \frac{3}{4}r(\epsilon))。
- 定理 4 ：设 (C) 是任何在 ID - Neg 子式下封闭的函数类，(T) 是具有查询复杂度 (q(\epsilon))、粒度 (c(\epsilon)) 和拒绝参数 (r(\epsilon)) 的单边独立测试器。设 (\epsilon_1 = \frac{r(\epsilon)}{4q(\epsilon)})，(q’(\epsilon) = \lceil \log(Prod(\epsilon) \cdot Prod(\epsilon_1)) \rceil)。则存在一个单边 (q’) - 规范测试器 (Canon(T)) 用于 (C)，在输入参数 (\epsilon) 时，其拒绝参数为 (\frac{\frac{3r(\epsilon)}{4}}{1 - \frac{r(\epsilon)}{4}} \cdot r(\epsilon_1))。

2. 证明概述

2.1 独立测试器的执行

独立测试器 (T = (T_1, T_2)) 在输入参数 (\epsilon) 时，会将 (n) 个变量进行 (2^{q(\epsilon)}) 路分区，每个变量独立地以适当的概率分配到随机选择的子集中。所有查询都遵循这个分区。

2.2 规范测试器的初步尝试

从独立测试器 (T) 构建规范测试器 (Canon(T) = (Canon(T)_1, Canon(T)_2)) 的初步尝试如下：
- (Canon(T)_1) 将 (n) 个变量划分为 (2^{q’}) 个子集，期望大小为 (n/2^{q’})，并进行所有相应的查询。
- (Canon(T)_2) 选择 (Canon(T)_1) 分区的前 (Prod(\epsilon) \cdot k) 个子集（假设这些子集总共包含 (n’) 个变量），忽略最后 (rem) 个子集中的变量。
- 对于前 (Prod(\epsilon) \cdot k) 个子集中的 (n’) 个变量，(Canon(T)_2) 可以通过将这些 (Prod(\epsilon) \cdot k) 个子集合并为 (2^{q’(\epsilon)}) 个具有适当期望大小的子集，完美模拟独立测试器 (T) 在这些 (n’) 个变量上以参数 (\epsilon) 执行时创建的分区。

然而，这种模拟存在问题，即如何设置剩余 (rem) 个子集中的额外变量。虽然 (n’) 个变量忠实地模拟了独立测试器 (T) 在 (n’) 个变量函数上以输入参数 (\epsilon) 运行时的查询字符串分布，但实际查询有额外的 (rem) 个变量，且相应的响应是根据 (n) 变量函数 (f) 得到的，因此不能保证 (T_2) 以高概率正确回答。

2.3 规范测试器的实际构造

2.3.1 双边独立测试器和 Noisy - Neg 子式下封闭的类

将双边独立测试器 (T) 转换为双边规范测试器 (Canon(T)) 的构造如下：
- 第一部分 ：近似 (NS_{\eta’}(f))，并拒绝任何 (NS_{\eta’}(f)) 明显高于 (NS_{\eta’}(C)) 的 (f)。
- 第二部分 ：模拟独立测试器 (T) 生成的分区。设 (F_+) 包含来自 (rem) 个“剩余”子集中前 (rem/2) 个子集的变量，(F_-) 包含后 (rem/2) 个子集的变量。定义 (f’) 为 (f) 的限制，其中 (F_+) 中的所有变量固定为 1，(F_-) 中的所有变量固定为 0。
- (Canon(T)) 可以完美模拟 (T_1) 在上述分区下根据 (f’) 生成的 (q) 个查询 - 答案对。由于 (C) 在否定下封闭，可以假设每个查询在 ({0, 1}^n) 上是均匀分布的。对于每个均匀随机查询字符串 (x)，(f’(x)) 等价于 (f(y))，其中 (y) 是与 (x) 具有 ((1 - 2\eta’)) 相关性的随机字符串。通过选择足够小的 (\eta’)（和足够大的 (q’)），以高概率 (f(x)) 等于 (f’(x))，因此 (T_2) 以高概率在目标函数 (f) 和 (f’) 上生成相同的输出。

2.3.2 单边独立测试器和 ID - Neg 子式下封闭的类

将单边独立测试器 (T) 转换为单边规范测试器 (Canon(T)) 的构造如下：
- 将 (n) 个变量划分为 (2^{q’(\epsilon)}) 个子集。设 (F_+) 包含来自 (rem) 个“剩余”子集中前 (rem/2) 个子集的变量，(F_-) 包含后 (rem/2) 个子集的变量。
- 定义 (f’) 为 (f) 经过 (F_{\epsilon_1}) 操作后的函数：选择 (F_+) 中字典序第一个元素作为 (x_{id})，将 (F_+) 和 (F_-) 中的所有变量分别与 (x_{id}) 进行标识。
- (Canon(T)) 选择适当的查询字符串，构造查询 - 答案对，其中答案是 (f’) 在这些字符串上的相应值，并将这些查询和响应传递给 (T_2) 并响应。

证明正确性分两部分：
- 首先，以高概率 (Canon(T)) 成功测试目标函数 (f’)。
- 其次，证明如果 (f \in C) 且 (C) 在 ID - Neg 子式下封闭，则 (f’ \in C)；如果 (f) 与 (C) 的距离为 (\epsilon)，则以高概率 (f’) 与 (C) 的距离为 (\epsilon_1)，其中 (\epsilon_1) 仅依赖于 (\epsilon)。

2.4 流程图

graph TD;
    A[输入参数 ϵ] --> B[独立测试器 T 执行];
    B --> C[生成 2^q(ϵ) 路分区];
    C --> D[查询遵循分区];
    D --> E[尝试构建规范测试器 Canon(T)];
    E --> F[Canon(T)_1 分区 n 个变量];
    F --> G[进行查询];
    G --> H[Canon(T)_2 选择子集];
    H --> I[模拟 T 的分区];
    I --> J[存在设置额外变量问题];
    J --> K[实际构造规范测试器];
    K --> L[双边情况构造];
    K --> M[单边情况构造];
    L --> N[近似 NSη'(f)];
    L --> O[定义 f'];
    L --> P[模拟查询 - 答案对];
    M --> Q[划分 n 个变量];
    M --> R[定义 f'];
    M --> S[构造查询 - 答案对];
    N --> T[拒绝 NSη'(f) 高的 f];
    P --> U[T2 以高概率正确输出];
    S --> V[传递查询和响应给 T2];
    V --> W[Canon(T) 响应];

2.5 表格总结

测试器类型	适用类	主要构造步骤	成功标准
独立测试器	通用	分区变量、设置查询字符串概率、查询、计算	单边和双边不同标准
规范测试器	Noisy - Neg 子式下封闭类	近似 (NS_{\eta’}(f))、定义 (f’)、模拟查询 - 答案对	单边和双边不同标准
规范测试器	ID - Neg 子式下封闭类	划分变量、定义 (f’)、构造查询 - 答案对	单边和双边不同标准

3. 随机图中独立集的研究

3.1 问题背景

我们关注的是具有给定平均度的随机图中最大独立集 (S) 的可能大小。当平均度为常数时，很容易看出 (|S| = \Theta(n))。Shamir 和 Spencer 证明了对于任何固定的 (n)，(|S|) 紧紧集中在其均值附近。此外，Bayati、Gamarnik 和 Tetali 最近表明，(|S|/n) 以高概率收敛到一个极限。因此，对于每个常数 (c)，存在一个常数 (\alpha_{crit} = \alpha_{crit}(c))，使得：
[
\lim_{n \to \infty} Pr[G(n, p = c/n) \text{ 有大小为 } \alpha n \text{ 的独立集}] =
\begin{cases}
1 & \alpha < \alpha_{crit} \
0 & \alpha > \alpha_{crit}
\end{cases}
]
通过标准论证，这在 (G(n, m = cn/2)) 中同样成立。

我们的目标是将 (\alpha_{crit}) 作为 (c) 的函数进行界定，或者等价地，将 (c_{crit} = \sup {c : \alpha_{crit}(c) \geq \alpha}) 作为 (\alpha) 的函数进行界定。

3.2 已有结果

对于 (c \leq e)，Karp 和 Sipser 的贪心算法渐近地找到一个最大独立集，通过微分方程分析该算法可以得到 (\alpha_{crit}) 的精确值。
对于较大的 (c)，Frieze 确定了 (\alpha_{crit}) 到 (o(1/c)) 的精度，其中 (o) 指的是 (c) 很大时的极限。
Coja - Oghlan 和 Efthymiou 改进了这些界限，并对独立集的结构进行了详细研究。

3.3 研究方法

我们采用加权二阶矩方法，受 Achlioptas 和 Peres 关于随机 (k - SAT) 工作的启发，为每个独立集赋予一个基于其顶点总度数的权重。这样做的目的不仅是为了改进当前问题的界限，还希望推动发明能够抵消随机结构中局部相关性的随机变量的技术发展。

3.4 模型定义

我们在修改后的 (G(n, m)) 模型（称为 (\tilde{G}(n, m))）中进行研究。对于 (m) 条边中的每一条，我们均匀且独立地选择两个顶点 (u) 和 (v) 并连接它们，这可能会导致一些多重边或自环。具有自环的顶点不能属于独立集。在稀疏情况下，当 (m = cn/2) 为常数时，(\tilde{G}(n, m = cn/2)) 以常数正概率没有多重边或自环，此时它在通常的 (G(n, m = cn/2)) 模型（边从不同顶点对中无放回选择）中是均匀的。因此，任何在 (\tilde{G}(n, m)) 中以高概率成立的性质在 (G(n, m)) 中也以高概率成立，我们在 (\tilde{G}(n, m)) 中证明的关于 (\alpha_{crit}) 的任何界限在 (G(n, m)) 中同样成立。

3.5 第一矩上界

设 (X) 表示 (\tilde{G}(n, m)) 中大小为 (\alpha n) 的独立集的数量。根据期望的线性性，(E[X]) 是所有 (\binom{n}{\alpha n}) 个大小为 (\alpha n) 的顶点集的概率之和，即一个给定的顶点集是独立集的概率。由于 (m) 条边 ((u, v)) 是独立选择的，且对于每条边，(u, v \in S) 的概率为 (\alpha^2)，所以：
[
E[X] = \binom{n}{\alpha n} (1 - \alpha^2)^m
]
在 (n \to \infty) 的极限下，使用 Stirling 近似 (n! = (1 + o(1))\sqrt{2\pi n} n^n e^{-n})，可得：
[
\binom{n}{\alpha n} = \Theta \left( \frac{1}{\sqrt{n}} e^{n h(\alpha)} \right)
]
其中 (h) 是熵函数 (h(\alpha) = -\alpha \ln \alpha - (1 - \alpha) \ln(1 - \alpha))，(\Theta) 隐藏了平滑依赖于 (\alpha) 的常数。因此：
[
E[X] = \Theta \left( \frac{1}{\sqrt{n}} e^{n (h(\alpha) + (c/2) \ln(1 - \alpha^2))} \right)
]
对于每个 (c)，使得 (h(\alpha) + (c/2) \ln(1 - \alpha^2) = 0) 的 (\alpha) 是 (\alpha_{crit}(c)) 的上界，因为对于更大的 (\alpha)，期望 (E[X]) 呈指数级小。

将其参数化为 (c_{crit}(\alpha))，可得上界：
[
c_{crit}(\alpha) \leq 2 \frac{\alpha \ln \alpha + (1 - \alpha) \ln(1 - \alpha)}{\ln(1 - \alpha^2)} \leq 2 \left( \frac{\ln(1/\alpha) + 1}{\alpha} \right)
]

3.6 下界证明目标

我们将证明一个几乎匹配的下界。

3.7 流程图

graph TD;
    A[定义随机图模型 G~(n, m)] --> B[计算大小为 αn 的独立集数量 X 的期望 E[X]];
    B --> C[使用 Stirling 近似];
    C --> D[得到 E[X] 的表达式];
    D --> E[确定 αcrit(c) 的上界];
    E --> F[参数化为 ccrit(α)];
    F --> G[得到 ccrit(α) 的上界];
    G --> H[证明几乎匹配的下界];

3.8 表格总结

研究内容	已有结果	本文方法	目标
随机图中最大独立集大小	不同 (c) 范围有不同精度的 (\alpha_{crit}) 界限	加权二阶矩方法	改进 (\alpha_{crit}) 和 (c_{crit}) 的界限
模型	(G(n, p)) 和 (G(n, m))	修改后的 (\tilde{G}(n, m))	利用模型性质证明界限
界限	上界通过第一矩方法得到	证明几乎匹配的下界	更精确地界定 (\alpha_{crit}) 和 (c_{crit})

4. 总结

本文主要围绕布尔函数性质测试和随机图中独立集的研究展开。在布尔函数性质测试方面，我们介绍了独立测试器和规范测试器的概念、工作方式以及主要结果，通过详细的构造和证明，说明了如何将独立测试器转换为规范测试器。在随机图中独立集的研究中，我们阐述了问题背景、已有结果，采用加权二阶矩方法在修改后的随机图模型中进行研究，并给出了第一矩上界和下界证明目标。通过这些研究，我们在两个不同领域都取得了一定的进展，为相关领域的进一步研究提供了新的思路和方法。

总的来说，这些研究不仅有助于我们更深入地理解布尔函数和随机图的性质，还为实际应用中的算法设计和性能分析提供了理论支持。未来的研究可以进一步探索如何优化这些测试器和界限，以及将这些方法应用到更广泛的问题中。