增量可满足性问题解决方案验证方法-优快云博客

证明增量可满足性问题解决方案的正确性

该方法使得在增量SAT问题中能够生成机器可检查的证明，其中问题约束会随时间逐渐添加。

自动推理与SAT求解器

自动推理可用于数学证明软件或硬件是否会按预期工作。在实践中，自动推理通常依赖称为SAT求解器的程序，这些程序确定描述系统约束的形式表达式是否可满足。SAT问题 notoriously 困难（这是原始的NP完全问题），SAT求解器使用各种巧妙技巧使其易于处理：流行的SAT求解器有数万行代码。但我们如何知道SAT求解器关于给定表达式可满足性的决策是可靠的？这些程序规模庞大，使用形式分析验证它们将是一项巨大工作。

一个解决方案是让SAT求解器生成其推理的记录——跟踪——可由自动证明检查器验证。证明检查器是一个相对简单的程序，比SAT求解器更容易验证。对于所有约束可以一次性指定的SAT问题——即使是非常复杂的SAT问题——存在可靠生成机器可检查证明的方法。

不幸的是，在大多数实际情况下，SAT问题的约束不能一次性全部指定。通常，在验证代码、硬件或网络性能时，我们希望从检查一个约束开始，然后根据其是否适用，检查第二个约束，依此类推，逐个构建我们的约束集。现有的生成可检查证明的方法不适用于此类增量SAT问题。

增量SAT问题的证明生成

在今年的计算机辅助设计形式方法会议（FMCAD）上，我们提出了一种为增量SAT问题生成可检查证明的方法。SAT问题包含一长串约束，每个约束的表达称为子句。为了使SAT问题易于处理，SAT求解器删除那些可以通过满足其他子句的相同真值分配满足的子句。

对于增量SAT，有时需要恢复已删除的子句，以确保在添加新约束时的一致性。在这种情况下，我们的证明生成方法将恢复的子句视为从未被删除。这个简单的技巧使现有的证明生成框架能够推广到增量SAT。我们在下面更详细地解释。

增量SAT

SAT问题是使用变量名和布尔运算符∧（与）和∨（或）表达的一系列约束。问题很简单：是否存在对变量的某种真值分配使表达式为真。例如，表达式（A ∨ B）∧（¬A ∨ ¬B）是可满足的，因为如果A或B为真而另一个为假，则该表达式为真。该表达式有两个子句：（A ∨ B）和（¬A ∨ ¬B）。

随着子句数量的增加，这个看似直接的问题变得难以处理。SAT求解器用来简化它的一个技巧是，如果一个子句与第二个子句的合取与第二个子句单独是等可满足的，则删除该子句，其中“等可满足”意味着两个表达式要么都可满足，要么都不可满足。

例如，考虑一个包含子句（A ∨ B）和（¬A ∨ ¬B）的增量SAT问题。求解器可能保留第一个子句并删除第二个，因为（A ∨ B）和合取（A ∨ B）∧（¬A ∨ ¬B）是等可满足的。然后，由于这是一个增量问题，添加了两个新子句（A）和（B）。（A ∨ B）∧（A）∧（B）是可满足的，因为如果A和B都为真，则（A ∨ B）为真。但如果A和B都为真，则（¬A ∨ ¬B）为假，因此需要将其添加回表达式，否则SAT求解器可能给出错误答案。

当处理增量SAT问题的SAT求解器删除一个子句时，它将其存储在称为重建栈的缓冲区中，同时存储一个真值分配，确保我们可以从求解器修改的问题中重建原始问题中的有效分配。当向问题表达式添加新子句时，如果满足它所需的真值与重建栈中的任何分配冲突，则将冲突的子句恢复到问题表达式并重新评估。它们可能收到不同的真值分配——或者求解器可能得出结论认为表达式不可满足。

在算法上，这个过程是有效的：它确保SAT求解器的判断是可靠的。但其逻辑难以用形式证明的语言捕捉。因此，虽然今天的SAT求解器可以解决增量SAT问题，但它们很少尝试证明其解决方案是可靠的。

生成证明

这就是我们的方法发挥作用的地方。除了从问题表达式中删除子句外，SAT求解器还添加子句。这些添加是由表达式中已有的子句逻辑蕴含的，因此它们不影响可满足性，但可能使求解器更容易识别子句之间的潜在冲突。

典型的证明生成器逐步遍历所有这些添加和删除的跟踪，构建其有效性的证明。我们的方法相反，从跟踪的末尾开始向后工作。当我们在证明中找到恢复子句的步骤时，我们将该子句存储在缓冲区中；如果我们后来（即跟踪中较早的部分）找到同一子句的删除，我们只需删除原始删除和随后的恢复。一旦我们从底部到顶部清理了跟踪，我们从顶部向下再次处理它，以传统方式构建证明。

由于删除的子句与表达式中剩余的子句是等可满足的，它们的删除对后续证明步骤的有效性没有影响——至少直到与新添加子句的冲突点，在那里删除的子句被重新添加。因此，将删除视为从未发生不会损害证明的可靠性。

为了评估我们方法的实用性，我们修改了当前最流行的SAT求解器之一来实现它，并在包含300个增量SAT问题的数据集上进行了测试，其中6个是可满足的，294个是不可满足的。修改后的求解器为所有294个不可满足的示例生成了有效证明。（六个可满足的示例通过真值分配的选择证明是可满足的。）我们的算法也足够高效，具有实用性，大约需要一分钟生成一个1GB的证明，或相对于求解时间约5%的开销。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）