增量可满足性问题解决方案验证方法

证明增量可满足性问题解决方案的正确性

该方法使得在增量SAT问题中能够生成机器可检查的证明,其中问题约束会随时间逐渐添加。

自动推理与SAT求解器

自动推理可用于数学证明软件或硬件是否会按预期工作。在实践中,自动推理通常依赖称为SAT求解器的程序,这些程序确定描述系统约束的形式表达式是否可满足。SAT问题 notoriously 困难(这是原始的NP完全问题),SAT求解器使用各种巧妙技巧使其易于处理:流行的SAT求解器有数万行代码。但我们如何知道SAT求解器关于给定表达式可满足性的决策是可靠的?这些程序规模庞大,使用形式分析验证它们将是一项巨大工作。

一个解决方案是让SAT求解器生成其推理的记录——跟踪——可由自动证明检查器验证。证明检查器是一个相对简单的程序,比SAT求解器更容易验证。对于所有约束可以一次性指定的SAT问题——即使是非常复杂的SAT问题——存在可靠生成机器可检查证明的方法。

不幸的是,在大多数实际情况下,SAT问题的约束不能一次性全部指定。通常,在验证代码、硬件或网络性能时,我们希望从检查一个约束开始,然后根据其是否适用,检查第二个约束,依此类推,逐个构建我们的约束集。现有的生成可检查证明的方法不适用于此类增量SAT问题。

增量SAT问题的证明生成

在今年的计算机辅助设计形式方法会议(FMCAD)上,我们提出了一种为增量SAT问题生成可检查证明的方法。SAT问题包含一长串约束,每个约束的表达称为子句。为了使SAT问题易于处理,SAT求解器删除那些可以通过满足其他子句的相同真值分配满足的子句。

对于增量SAT,有时需要恢复已删除的子句,以确保在添加新约束时的一致性。在这种情况下,我们的证明生成方法将恢复的子句视为从未被删除。这个简单的技巧使现有的证明生成框架能够推广到增量SAT。我们在下面更详细地解释。

增量SAT

SAT问题是使用变量名和布尔运算符∧(与)和∨(或)表达的一系列约束。问题很简单:是否存在对变量的某种真值分配使表达式为真。例如,表达式(A ∨ B)∧(¬A ∨ ¬B)是可满足的,因为如果A或B为真而另一个为假,则该表达式为真。该表达式有两个子句:(A ∨ B)和(¬A ∨ ¬B)。

随着子句数量的增加,这个看似直接的问题变得难以处理。SAT求解器用来简化它的一个技巧是,如果一个子句与第二个子句的合取与第二个子句单独是等可满足的,则删除该子句,其中“等可满足”意味着两个表达式要么都可满足,要么都不可满足。

例如,考虑一个包含子句(A ∨ B)和(¬A ∨ ¬B)的增量SAT问题。求解器可能保留第一个子句并删除第二个,因为(A ∨ B)和合取(A ∨ B)∧(¬A ∨ ¬B)是等可满足的。然后,由于这是一个增量问题,添加了两个新子句(A)和(B)。(A ∨ B)∧(A)∧(B)是可满足的,因为如果A和B都为真,则(A ∨ B)为真。但如果A和B都为真,则(¬A ∨ ¬B)为假,因此需要将其添加回表达式,否则SAT求解器可能给出错误答案。

当处理增量SAT问题的SAT求解器删除一个子句时,它将其存储在称为重建栈的缓冲区中,同时存储一个真值分配,确保我们可以从求解器修改的问题中重建原始问题中的有效分配。当向问题表达式添加新子句时,如果满足它所需的真值与重建栈中的任何分配冲突,则将冲突的子句恢复到问题表达式并重新评估。它们可能收到不同的真值分配——或者求解器可能得出结论认为表达式不可满足。

在算法上,这个过程是有效的:它确保SAT求解器的判断是可靠的。但其逻辑难以用形式证明的语言捕捉。因此,虽然今天的SAT求解器可以解决增量SAT问题,但它们很少尝试证明其解决方案是可靠的。

生成证明

这就是我们的方法发挥作用的地方。除了从问题表达式中删除子句外,SAT求解器还添加子句。这些添加是由表达式中已有的子句逻辑蕴含的,因此它们不影响可满足性,但可能使求解器更容易识别子句之间的潜在冲突。

典型的证明生成器逐步遍历所有这些添加和删除的跟踪,构建其有效性的证明。我们的方法相反,从跟踪的末尾开始向后工作。当我们在证明中找到恢复子句的步骤时,我们将该子句存储在缓冲区中;如果我们后来(即跟踪中较早的部分)找到同一子句的删除,我们只需删除原始删除和随后的恢复。一旦我们从底部到顶部清理了跟踪,我们从顶部向下再次处理它,以传统方式构建证明。

由于删除的子句与表达式中剩余的子句是等可满足的,它们的删除对后续证明步骤的有效性没有影响——至少直到与新添加子句的冲突点,在那里删除的子句被重新添加。因此,将删除视为从未发生不会损害证明的可靠性。

为了评估我们方法的实用性,我们修改了当前最流行的SAT求解器之一来实现它,并在包含300个增量SAT问题的数据集上进行了测试,其中6个是可满足的,294个是不可满足的。修改后的求解器为所有294个不可满足的示例生成了有效证明。(六个可满足的示例通过真值分配的选择证明是可满足的。)我们的算法也足够高效,具有实用性,大约需要一分钟生成一个1GB的证明,或相对于求解时间约5%的开销。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值