【计算复杂性理论】证明复杂性（二）：归结（Resolution）与扩展归结（Extended Resolution）证明系统

原创

已于 2024-10-22 14:59:22 修改 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#计算复杂性 #证明复杂性 #归结 #数理逻辑 #证明论

于 2023-07-07 17:37:19 首次发布

往期文章：

【计算复杂性理论】证明复杂性（Proof Complexity）（一）：简介

文章目录

一、基础定义
二、归结证明系统
三、宽度和大小
四、扩展归结证明系统
参考文献

归结证明系统是一种非常简单、非常优雅的证明系统，它在SAT求解和自动定理证明中有广泛应用。

在这篇文章中，我们规定输入是子句集，也就是一些子句的集合，它们和合取范式是等价的。合取范式的子句组成的集合就是子句集；子句集可满足等价于对应的合取范式可满足。

一、基础定义

为了方便表示文字 $l$ 及其否定，我们定义 $l^{\varepsilon}=\begin{cases}l,&\varepsilon=1\\\neg l,&\varepsilon=0\end{cases}$ 。当 $l$ 被赋值为 $\varepsilon$ 时， $l^\varepsilon=1$ 。

在演算式证明系统中，证明是由证明步骤（proof steps）（也叫证明行，proof lines）组成的。证明的每个步骤可能是一个公式，一系列公式或具有某种形式的公式，具体取决于演算的规则。定义 $\mathbf{k}(\pi)$ 为证明 $\pi$ 的步骤数（行数）；证明系统 $P$ 中永真式 $\alpha$ 最短证明的步骤数记作 $\mathbf{k}_P(\alpha)$ 。

二、归结证明系统

归结证明系统的每一行是一个子句（即简单析取式） $C:l_1\lor l_2\lor\cdots\lor l_w$ ，常写作集合 $\{l_1,l_2,\cdots,l_w\}$ 。子句 $C\cup\{l\}$ 简写作 $C, l$ 。归结证明系统只有一条规则，即归结规则： $\underline{C,l\quad D,\neg l}\\C\cup D$ 比如你有两个子句 $a\lor b\lor l$ 和 $b\lor\neg l\lor c$ ，那么你就可以得到子句 $a\lor b\lor c$ 。

归结规则是可靠的，因为 $(C\lor l)\land(D\lor\neg l)\models C\lor D$ 。可以这么理解：若 $C\lor l$ 成立，则 $C\lor D\lor l$ 成立；若 $D\lor\neg l$ 成立，则 $C\lor D\lor\neg l$ 成立；将这两个推论结合得到 $C\lor D$ 成立。

归结是一个反驳证明系统（refutation proof system）：它不是用来证明一个公式是永真式的，而是证明一个公式不可满足。归结从输入的几个子句开始，不断应用归结规则推出新的子句，最后得到空子句 $\emptyset$ 就说明输入的合取范式是不可满足的（合取范式就是一些子句的合取）。

定义1 设 $\mathcal{C}$ 是一个子句集。 $\mathcal{C}$ 的一个归结反驳是一系列子句 $D_1,D_2,\cdots,D_k$ ，满足：

对于任意 $i\le k$ ， $D_i$ 要么属于 $\mathcal{C}$ ，要么是从 $D_u$ 和 $D_v$ 通过归结规则推出来的；
$D_k=\emptyset$ 。

此时，归结反驳的步数就是 $k$ 。

下面我们来证明归结证明系统的完备性（completeness），即每个不可满足的子句集都有一个归结反驳。

定理2 设 $\mathcal{C}$ 是一个不可满足的子句集（即合取范式的各个子句组成的集合），则存在对 $\mathcal{C}$ 的一个归结反驳。

证明：设 $\mathcal{C}$ 涉及 $n$ 个变量，令 $p$ 是其中任意一个变量。我们可以把 $\mathcal{C}$ 分成四部分：

$\mathcal{C}_{0,0}=\{D\in \mathcal{C}|D\text{不含}p\text{或}\neg p\}$
$\mathcal{C}_{1,0}=\{D\in \mathcal{C}|D\text{含}p\text{但不含}\neg p\}$
$\mathcal{C}_{0,1}=\{D\in \mathcal{C}|D\text{不含}p\text{但含}\neg p\}$
$\mathcal{C}_{1,1}=\{D\in \mathcal{C}|D\text{含}p\text{和}\neg p\}$ （这种情况不用考虑，因为 $p\lor\neg p\Leftrightarrow 1$ 自动满足）

设 $R (u, v)$ 代表 $u$ 和 $v$ 归结所得的子句。令 $\mathcal{H}=\{R(u,v)|u\in\mathcal{C}_{1,0},v\in\mathcal{C}_{0,1}\}$ ，也就是只含 $p$ 和只含 $\neg p$ 的子句归结所得的所有子句的集合。那么 $\mathcal{C}_{0,0}\cup \mathcal{H}$ 是不可满足的。这是因为，倘若一个赋值满足了 $\mathcal{C}_{0,0}\cup \mathcal{H}$ 中的每个子句，那么它就会满足 $\mathcal{C}_{0,1}$ 的全部子句或者 $\mathcal{C}_{1,0}$ 的全部子句。否则的话，如果它不满足 $\mathcal{C}_{0,1}$ 中的一个子句 $u\lor\neg p$ 也不满足 $\mathcal{C}_{1,0}$ 中的一个子句 $v\lor p$ ，那么它也不会满足 $R(u\lor\neg p,v\lor p)=u\lor v$ 。所以说 $\mathcal{C}_{0,1}$ 和 $\mathcal{C}_{1,0}$ 中至少有一个是全部满足的。此时，我们在这个赋值的基础上设置 $p$ 的值，使得：如果 $\mathcal{C}_{0,1}$ 全部满足，则令 $p = 1$ 使得 $\mathcal{C}_{1,0}$ 也全部满足；如果 $\mathcal{C}_{1,0}$ 全部满足，则令 $p = 0$ 使得 $\mathcal{C}_{0,1}$ 也全部满足。这样， $\mathcal{C}_{0,0}$ 、 $\mathcal{C}_{0,1}$ 、 $\mathcal{C}_{1,0}$ 都全部满足，使得 $\mathcal{C}$ 全部满足，这与 $\mathcal{C}$ 不可满足矛盾。因此 $\mathcal{C}_{0,0}\cup \mathcal{H}$ 是不可满足的。

$\mathcal{C}_{0,0}\cup \mathcal{H}$ 的每个子句都是从 $\mathcal{C}$ 中直接或应用一次归结得到的，它相比 $\mathcal{C}$ 少了一个变量。重复进行消去变量的过程，总能消去所有变量并得到空子句 $\emptyset$ 。这样我们就证明了归结的完备性。

三、宽度和大小

一个子句 $D$ 的大小， $∣ D ∣$ ，也被称为子句 $D$ 的宽度（width），记作 $\mathbf{w}(D)$ ，它也就是 $D$ 中文字的个数。对于子句集 $\mathcal{C}$ ，定义其宽度 $\mathbf{w}(C)=\max\limits_{D\in\mathcal{C}}\mathbf{w}(D)$ ，即其中宽度最大的子句的宽度。一个归结证明 $\pi$ 的宽度 $\mathbf{w}(\pi)$ 定义为 $\pi$ 中出现的宽度最大的子句的宽度。定义 $\mathbf{w}_R(\mathcal{C})$ 为子句集 $\mathcal{C}$ 宽度最小的证明的宽度，即 $\mathbf{w}_R(\mathcal{C})=\min\limits_{\pi}\mathbf{w}(\pi)$ 。

为什么要研究证明的宽度呢？这是因为，对于一个宽度为 $w$ 的证明，其行数（即步骤数）是有上界的：它不会超过所有宽度至多为 $w$ 的子句的个数。如果我们要求子句中 $p$ 和 $\neg p$ 不得同时出现，则宽度为 $w$ 的子句的个数为 $2^w C_{n}^{w}$ ，其中 $n$ 是变量个数。我们接下来将会看到，一个短的归结证明可以被转化为一个窄的归结证明（即宽度较小的归结证明）。如果我们能证明某个子句集的证明宽度有下界，那么就能证明其证明的行数也有下界。

我们称一个部分赋值为限制（restriction）。它是对某些变量的赋值。对于文字 $l$ ，布尔值 $\varepsilon\in\{0,1\}$ 和子句 $C$ ，我们定义 $C$ 在赋值 $l=\varepsilon$ 限制下的结果为子句 $C\upharpoonright l=\varepsilon:=\begin{cases} C,&\text{若}l\text{和}\neg l\text{都没有在}C\text{中出现}\\ 1,&\text{若}l\text{在}C\text{中出现}\\ C\setminus\{l^{\neg\varepsilon}\},&\text{若}l^{\neg\varepsilon}\text{在}C\text{中出现（这就是}C\text{和}l^\varepsilon\text{归结的结果} \end{cases}$ 比如，子句 $C=a\lor b\lor c$ 在赋值 $a = 1$ 下变成 $1$ （因为它直接被满足了），在赋值 $a = 0$ 下变成 $b\lor c$