66、局部可采样源的提取器与下界及 Frieze - Kannan 正则引理的确定性算法

最新推荐文章于 2025-10-11 14:25:29 发布

seed

最新推荐文章于 2025-10-11 14:25:29 发布

阅读量27

点赞数

CC 4.0 BY-SA版权

分类专栏：近似与随机算法前沿文章标签：局部可采样源提取器 Frieze-Kannan正则引理确定性算法

本文链接：https://blog.youkuaiyun.com/seed/article/details/153600494

近似与随机算法前沿专栏收录该内容

90 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

局部可采样源的提取器与下界及 Frieze - Kannan 正则引理的确定性算法

在计算机科学领域，随机源提取器和图的正则划分是非常重要的研究内容。随机源提取器用于从弱随机源中提取高质量的随机比特，而图的正则划分则在图论和算法设计中有着广泛的应用。下面将详细介绍相关的概念、定理以及算法。

局部可采样源的提取器

基本概念与构造

提取器组件 ：
- 设 $Ext’ : {0, 1}^n \to {0, 1}^{m’}$ 为一个提取器。
- $Ext’_1 : {0, 1}^n \to {0, 1}^s$ 是 $Ext’$ 的前 $s$ 位。
- $Ext’_2 : {0, 1}^n \to {0, 1}^{m’ - s}$ 是 $Ext’$ 的后 $m’ - s$ 位。
- $Samp : {0, 1}^s \to \binom{{1, \ldots, n}}{p}$ 是一个采样器，其中 $\binom{{1, \ldots, n}}{p}$ 表示 ${1, \ldots, n}$ 中大小为 $p$ 的子集的集合。
- $SExt : {0, 1}^p \times {0, 1}^{m’ - s} \to {0, 1}^m$ 是一个带种子的提取器。
最终提取器 ：定义 $Ext : {0, 1}^n \to {0, 1}^m$ 为 $Ext(z) = SExt(z|_{Samp(Ext’_1(z))}, Ext’_2(z))$。

输出长度的提升

原结果 ：结合之前的结果，在 $d \leq o(\log n)$ 且最小熵 $k$ 至少为 $n^{2/3 + \gamma}$ 的条件下，可得到输出长度为 $\Omega(k^2 / nd^3 2^d)$ 的 $d$ - 局部源提取器。
改进方法 ：通过“获取独立种子”的技术，可将输出长度提升至 $\Omega(k^2 / nd)$。具体策略是利用确定性提取器的输出，一部分用于采样源的坐标集，另一部分作为种子输入到带种子的提取器中。这里使用了 Nisan 和 Zuckerman 的引理的加强版本，该版本在最小熵率上仅损失一个常数因子。
采样器定义 ：称 $Samp : {0, 1}^s \to \binom{{1, \ldots, n}}{p}$ 是一个 $(\mu, \eta)$ - 采样器，如果对于每个 $g : {1, \ldots, n} \to [0, 1]$ 且 $\frac{1}{n} \sum_{j = 1}^n g(j) \geq \mu$，有 $Pr_{\sigma \sim U_s} \left[ \frac{1}{p} \sum_{j \in Samp(\sigma)} g(j) < \mu / 2 \right] \leq \eta$。
定理 7 ：存在常数 $\alpha > 0$，使得以下结论成立。假设 $Ext’$ 是一个 $(k’, \epsilon’)$ - $d$ - 局部源提取器，$Samp$ 是一个 $(\frac{k}{2n} \log(\frac{4n}{k}), \eta)$ - 采样器，$SExt$ 是一个带种子的 $(\frac{pk}{4n}, \epsilon’‘)$ - 提取器。则 $Ext$ 是一个 $(k, \epsilon)$ - $d$ - 局部源提取器，其中 $k = k’ + pd$，$\epsilon = \epsilon’(2^{s + 1} + 1) + 2\sqrt{\eta} + 2^{-\alpha k} + \epsilon’‘$。

采样输入 - 输出对的改进下界

局部采样器与局部源定义 ：
- 定义 $(d, c, k)$ - 局部采样器为一个 $(d, c)$ - 局部采样器，其关联二分图左侧至少有 $k$ 个非孤立节点。
- 称 ${0, 1}^n$ 上的分布是一个 $(d, c, k)$ - 局部源，如果它等于某个 $(d, c, k)$ - 局部采样器 $f$（输入长度为 $r$）的 $f(U_r)$。需注意，$(d, c, k)$ - 局部源的最小熵可能小于 $k$。
定理 8 ：假设 $Ext : {0, 1}^n \to {0, 1}$ 是一个 $(0, \epsilon)$ - $(d, 8d, n/4)$ - 局部源提取器，其中 $d < n/8$。则对于 ${0, 1}^{n + 1}$ 上的每个 $d$ - 局部源 $D$，有 $|D - (U_n, Ext(U_n))| \geq 1/2 - \epsilon - 2^{-n/2}$。

Frieze - Kannan 正则引理的确定性算法

背景与动机

Szemerédi 正则引理 ：是处理组合问题的强大工具，可将任何（稠密）图 $G = (V, E)$ 的顶点集划分为有限个顶点集 $V_1, \ldots, V_k$，使得几乎所有的二分图 $(V_i, V_j)$ 都是伪随机的。其算法应用需要高效构造满足引理条件的划分，已有算法能在 $O(n^{\omega})$ 或 $O(n^2)$ 时间内完成，其中 $\omega < 2.376$ 是快速矩阵乘法的指数。
Frieze - Kannan 正则引理 ：是一种稍弱的正则性概念（FK - 正则性），任何图都有一个 FK - 正则划分，其部分数量远少于 Szemerédi 划分。Frieze 和 Kannan 证明可在随机 $O(n^2)$ 时间内构造这样的划分，Alon 和 Naor 给出了确定性多项式时间算法，但该算法需求解半定规划，效率不高。Williams 提出能否在确定性次立方时间内构造 FK - 正则划分的问题。

主要结果

图的基本定义 ：
- 对于图 $G = (V, E)$ 中的子集 $A, B \subseteq V$，$e(A, B)$ 表示 $A$ 和 $B$ 之间的边数，每条包含在 $A \cap B$ 中的边计两次。密度 $d(A, B) = \frac{e(A, B)}{|A||B|}$。
- 顶点集划分 $P = {V_1, V_2, \ldots, V_k}$，其阶为集合 $V_i$ 的数量 $k$。公平划分是指所有集合大小为 $\lfloor n/k \rfloor$ 或 $\lceil n/k \rceil$。用 $d_{ij} = d(V_i, V_j)$（$i \neq j$）表示不同部分之间的密度，$d_{ii} = 0$。
Szemerédi 正则性 ：设 $A, B$ 是不相交的顶点集，称 $(A, B)$ 是 $\varepsilon$ - 正则的，如果对于所有满足 $|A’| \geq \varepsilon|A|$ 和 $|B’| \geq \varepsilon|B|$ 的 $A’ \subseteq A$ 和 $B’ \subseteq B$，有 $|d(A, B) - d(A’, B’)| \leq \varepsilon$。Szemerédi 正则引理表明，对于给定的 $\varepsilon > 0$，存在常数 $T(\varepsilon)$，使得任何图 $G$ 的顶点集可划分为 $k$ 个公平集 $V_1, \ldots, V_k$，其中 $k \leq T(\varepsilon)$，且除了 $\varepsilon k^2$ 对 $(i, j)$ 外，$(V_i, V_j)$ 都是 $\varepsilon$ - 正则的。
FK - 正则性 ：
- 定义：设 $P = {V_1, V_2, \ldots, V_k}$ 是图 $G$ 的顶点集划分。对于子集 $S, T \subseteq V$ 和 $1 \leq i \leq k$，令 $S_i = S \cap V_i$，$T_i = T \cap V_i$。定义 $\Delta(S, T) = e(S, T) - \sum_{i \neq j} d_{ij}|S_i||T_j|$。如果划分 $P$ 是公平的，且对于所有子集 $S, T \subseteq V$，有 $|\Delta(S, T)| \leq \varepsilon n^2$，则称 $P$ 是 $\varepsilon$ - FK - 正则的。
- 算法结果 ：设计了一个 $\tilde{O}(n^{\omega})$ 时间的确定性算法来构造满足 FK - 正则引理条件的划分，同时还能在确定性 $\tilde{O}(n^{\omega})$ 时间内找到对称矩阵第一特征值的近似值。

总结

本文介绍了局部可采样源提取器的构造和输出长度的提升方法，以及 Frieze - Kannan 正则引理的确定性算法。通过这些技术，我们可以更高效地处理随机源和图的正则划分问题。

流程图

graph TD;
    A[输入图 G] --> B[检查 d 和 k 条件];
    B -- 满足 --> C[构造 d - 局部源提取器 Ext];
    C --> D[提升 Ext 输出长度];
    B -- 不满足 --> E[调整参数];
    E --> B;
    F[输入图 G] --> G[计算边密度等参数];
    G --> H[判断是否满足 FK - 正则性];
    H -- 是 --> I[输出 FK - 正则划分];
    H -- 否 --> J[调整划分];
    J --> G;

表格

概念	定义
$(d, c, k)$ - 局部采样器	一个 $(d, c)$ - 局部采样器，其关联二分图左侧至少有 $k$ 个非孤立节点
$(d, c, k)$ - 局部源	等于某个 $(d, c, k)$ - 局部采样器 $f$ 的 $f(U_r)$ 的分布
$\varepsilon$ - 正则	对于不相交顶点集 $A, B$，$
$\varepsilon$ - FK - 正则	公平划分 $P$ 满足 $

局部可采样源的提取器与下界及 Frieze - Kannan 正则引理的确定性算法

技术细节分析

局部可采样源提取器的技术要点

输出长度提升的原理 ：输出长度从 $\Omega(k^2 / nd^3 2^d)$ 提升至 $\Omega(k^2 / nd)$ 的关键在于“获取独立种子”技术。该技术将确定性提取器的输出进行拆分利用，一部分用于采样源的坐标集，另一部分作为种子输入到带种子的提取器中。Nisan 和 Zuckerman 引理的加强版本保证了在采样坐标时，边际分布的最小熵率损失较小，仅为一个常数因子，而不是原始引理中的对数因子，从而实现了输出长度的有效提升。
定理 7 的作用 ：定理 7 为构建更高效的 $d$ - 局部源提取器提供了理论依据。通过给定 $Ext’$、$Samp$ 和 $SExt$ 的条件，可以准确计算出 $Ext$ 的参数 $k$ 和 $\epsilon$，使得在不同的输入条件下，能够合理选择合适的提取器组件，以满足特定的最小熵和误差要求。

Frieze - Kannan 正则引理算法的技术要点

谱特征的应用 ：确定性 $\tilde{O}(n^{\omega})$ 时间算法依赖于对满足 Frieze - Kannan 正则引理性质的顶点划分的谱特征刻画。通过分析图的谱性质，可以更高效地判断和构造 FK - 正则划分。这种谱特征的应用使得算法能够避免传统方法中求解半定规划的高复杂度，从而实现了时间复杂度的优化。
特征值近似的意义 ：在算法设计中，能够在确定性 $\tilde{O}(n^{\omega})$ 时间内找到对称矩阵第一特征值的近似值是一个重要的技术突破。由于特征值的精确计算在某些情况下是不可行的（如高次多项式的代数根不存在），近似计算特征值可以在保证一定精度的前提下，大大提高算法的效率。

操作步骤与流程

局部可采样源提取器的构造步骤

确定输入参数 ：明确 $n$、$m’$、$s$、$p$、$k’$、$\epsilon’$、$\eta$ 和 $\epsilon’‘$ 等参数的值。
构造提取器组件 ：
- 定义 $Ext’ : {0, 1}^n \to {0, 1}^{m’}$。
- 确定 $Ext’_1$ 为 $Ext’$ 的前 $s$ 位，$Ext’_2$ 为 $Ext’$ 的后 $m’ - s$ 位。
- 构造 $Samp : {0, 1}^s \to \binom{{1, \ldots, n}}{p}$，使其满足 $(\frac{k}{2n} \log(\frac{4n}{k}), \eta)$ - 采样器的定义。
- 构造 $SExt : {0, 1}^p \times {0, 1}^{m’ - s} \to {0, 1}^m$，使其为带种子的 $(\frac{pk}{4n}, \epsilon’‘)$ - 提取器。
计算最终提取器 ：根据 $Ext(z) = SExt(z|_{Samp(Ext’_1(z))}, Ext’_2(z))$ 计算最终的提取器 $Ext$。

Frieze - Kannan 正则引理的划分构造步骤

输入图信息 ：输入图 $G = (V, E)$。
计算图参数 ：计算图中各子集的边数 $e(A, B)$ 和密度 $d(A, B)$，以及划分 $P = {V_1, V_2, \ldots, V_k}$ 下的 $d_{ij}$。
判断 FK - 正则性 ：对于所有子集 $S, T \subseteq V$，计算 $\Delta(S, T) = e(S, T) - \sum_{i \neq j} d_{ij}|S_i||T_j|$，判断 $|\Delta(S, T)| \leq \varepsilon n^2$ 是否成立。
调整划分 ：如果不满足 FK - 正则性条件，则调整划分 $P$，重复步骤 2 和 3，直到满足条件为止。
输出结果 ：输出满足 $\varepsilon$ - FK - 正则性的划分 $P$。

应用场景与展望

应用场景

随机源处理 ：局部可采样源提取器可用于从弱随机源中提取高质量的随机比特，在密码学、模拟退火算法等领域有广泛应用。通过提升提取器的输出长度，可以提高随机比特的利用率，增强系统的安全性和性能。
图算法设计 ：Frieze - Kannan 正则引理的确定性算法可用于设计近似算法和快速组合算法，如布尔矩阵乘法、最大割问题等。在这些问题中，通过高效构造 FK - 正则划分，可以在较短的时间内得到近似最优解。

展望

算法优化 ：进一步优化局部可采样源提取器的构造和 Frieze - Kannan 正则引理的算法，降低时间复杂度，提高算法的效率和稳定性。
新应用领域探索 ：探索这些技术在其他领域的应用，如机器学习、数据挖掘等，为这些领域的问题提供新的解决方案。

表格

操作	步骤
构造局部可采样源提取器	1. 确定输入参数；2. 构造提取器组件；3. 计算最终提取器
构造 FK - 正则划分	1. 输入图信息；2. 计算图参数；3. 判断 FK - 正则性；4. 调整划分；5. 输出结果

流程图

graph TD;
    A[确定输入参数] --> B[构造提取器组件];
    B --> C[计算最终提取器 Ext];
    D[输入图 G] --> E[计算图参数];
    E --> F[判断 FK - 正则性];
    F -- 是 --> G[输出 FK - 正则划分];
    F -- 否 --> H[调整划分];
    H --> E;