54、自动化定理证明中的理论组合技术解析

最新推荐文章于 2025-11-11 00:58:52 发布

原创最新推荐文章于 2025-11-11 00:58:52 发布 · 944 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#自动化定理证明 #Nelson-Oppen组合技术 #SLD归结

自动化定理证明中的理论组合技术解析

在自动化定理证明领域，常常需要处理多个理论的组合问题。本文将详细介绍Nelson - Oppen组合技术以及它与SLD归结的结合，同时分析其在不同类型理论中的应用和实验结果。

Nelson - Oppen组合技术

Nelson - Oppen组合技术用于将无量词可判定理论（记为$T_i$）的判定过程整合为它们并集的判定过程。这里要求各理论的签名是不相交的，即对于$i \neq j$，$sig(T_i) \cap sig(T_j)$为空。

下面是一些关键定义：
- i - 项 ：如果$t$是变量或者具有$f(s)$的形式且$f \in sig(T_i)$，则称$t$为$i$ - 项。
- 外来子项 ：若$t$是$i$ - 项，$s$是$t$的最大子项，且$s$是$j$ - 项（$j \neq i$），则称$s$为$t$的外来子项。
- 纯（i - ）项 ：如果$i$ - 项$t$仅包含$sig(T_i)$中的符号和变量，则称它为纯（i - ）项。

判定公式$F$在理论组合$T = \bigcup_{i} T_i$中的有效性的步骤如下：
1. 转换为析取范式 ：将公式$\neg F$转换为析取范式。只要证明任何一个合取式不可满足，就能确定$F$的有效性。
2. 同质化 ：在合取式$\Phi$中，对每个文字进行同质化处理。具体做法是，对于属于理论$T_i$的文字$L$，找出其参数中顶层函数符号不属于$sig(T_i)$的最大子项$t$，用新变量$x$替换$t$，并在合取式中添加等式$x = t$。这个过程递归地应用于所有文字，使得同质化后每个文字只包含一个理论的谓词和函数符号。
3. 拆分合取式 ：将得到的合取式拆分为$\Phi_i$，使得$\Phi_i$中的所有文字都属于$T_i$。
4. 检查不可满足性 ：如果某个$\Phi_i$在$T_i$中不可满足，则$\Phi$在$T$中不可满足。
5. 传播等式 ：如果在$T_i$中可以从$\Phi_i$推导出共享变量的等式析取式$x_1 = y_1 \vee \cdots \vee x_k = y_k$，则将这些等式传播到其他理论中。具体来说，对于等式析取式的任何一个析取项$x_j = y_j$，将其添加到所有$\Phi_k$中，并递归地执行步骤4。如果所有析取项的结果都不可满足，则$\Phi$在$T$中不可满足；如果没有可以从任何$\Phi_i$推导出的等式析取式（且步骤4未确定不可满足性），或者对于某个推导出的等式$x_j = y_j$，$\Phi_k \wedge x_j = y_j$对所有$k$都可满足，则$\Phi$在$T$中可满足。

下面是一个使用Nelson - Oppen组合方法的示例：
给定理论：
- $T_1 = { \forall x, y (q(x, y) \wedge (x = y) \Rightarrow p(x)) }$
- $T_2 = { \forall x (f(f(x)) = f(x) \vee f(f(f(x))) = f(x)) }$
- $T = T_1 \cup T_2$

要判定$T \models q(f(x), f(f(f(x)))) \wedge q(f(x), f(f(x))) \Rightarrow p(f(x))$：
1. 取否定 ：$q(f(x), f(f(f(x)))) \wedge q(f(x), f(f(x))) \wedge \neg p(f(x))$
2. 同质化 ：$q(u, v) \wedge u = f(x) \wedge v = f(f(f(x))) \wedge q(u’, v’) \wedge u’ = f(x) \wedge v’ = f(f(x)) \wedge \neg p(w) \wedge w = f(x)$
3. 拆分合取式 ：
- $\Phi_1 = q(u, v) \wedge q(u’, v’) \wedge \neg p(w)$
- $\Phi_2 = (u = f(x) \wedge v = f(f(f(x))) \wedge u’ = f(x) \wedge v’ = f(f(x))) \wedge w = f(x)$
4. 推导等式 ：
- $T_2, \Phi_2 \models w = u$
- $T_2, \Phi_2 \models w = u’$
- $T_2, \Phi_2 \models u = v \vee u’ = v’$
5. 检查不可满足性 ：
- $T_1, \Phi_1, w = u, w = u’, u = v$不可满足
- $T_1, \Phi_1, w = u, w = u’, u’ = v’$也不可满足

因此，$T \models q(f(x), f(f(f(x)))) \wedge q(f(x), f(f(x))) \Rightarrow p(f(x))$。

等式的析取会导致算法中的分支，影响其效率。如果理论中只能推导出单个等式，而不是包含两个或更多成员的析取式，则称这些理论为凸理论。

该算法在理论满足额外假设时是完备的，即理论$T_i$必须是稳定无限的，意味着每个公式$F$在$T_i$中可满足当且仅当它在$T$的某个无限模型中可满足。

下面是Nelson - Oppen组合技术判定公式有效性的流程图：

graph TD;
    A[开始] --> B[将¬F转换为析取范式];
    B --> C[对合取式进行同质化处理];
    C --> D[拆分合取式为Φi];
    D --> E{是否有Φi在Ti中不可满足};
    E -- 是 --> F[Φ在T中不可满足，结束];
    E -- 否 --> G{是否能推导出共享变量等式析取式};
    G -- 是 --> H[传播等式到其他理论];
    H --> E;
    G -- 否 --> I{是否所有析取项结果都不可满足};
    I -- 是 --> F;
    I -- 否 --> J[Φ在T中可满足，结束];

Nelson - Oppen过程与SLD归结的结合

将判定过程的组合技术扩展到理论组合中的定理证明时，需要克服一些困难：
1. 由于所考虑的理论可能是不可判定的，定理证明过程不一定会终止，这与判定过程不同。
2. 需要将各个证明组合成被证明公式的证明。在具体的确定性算法中，还需要确定尝试求解哪些共享变量之间的等式以及在哪个理论中求解。

这里主要关注Horn理论，在Horn理论中，SLD归结（一种用于逻辑编程的目标驱动策略，也称为反向链）是完备的。对于Horn理论，Nelson - Oppen算法中不会出现分支，即Horn理论是凸理论。原因是Horn理论有最小Herbrand模型$M_H$，因此适当的等式析取式不能是理论的结果。

算法使用迭代加深搜索，即搜索证明时限制证明的深度。如果在给定深度限制下找不到证明，则增加深度限制进行下一次尝试，以此克服理论可能的不可判定性。

等式在不同理论的底层证明器之间的传播通过一个池来保证，已证明的等式存储在池中，所有理论都可以访问该池。底层证明器采用具有深度限制搜索和单位引理缓存的SLD归结过程。

下面是具体的算法流程：
- solve NOP(Thy, Goal)过程 ：
1. 对所有证明设置给定的深度限制。
2. 如果要在基本理论组合（Thy）中证明一个（同质化的）文字，根据其签名选择所属理论，使用底层证明器（结合适当的事实和规则）尝试证明它。Pool - done中的文字在所有基本理论中都可作为事实使用。
3. 如果文字具有$eq(v(X), v(Y))$的形式（即共享变量之间的等式），是原始目标或作为子目标遇到：
- 如果$eq(v(x), v(y))$在Pool - done中，则子目标已解决。
- 如果$eq(v(x), v(y))$不在Pool - todo中，则将其插入Pool - todo并调用solve iter pool。
- 如果$eq(v(x), v(y))$在Pool - todo中但不在Pool - done中，则调用solve iter pool。
4. 如果原始文字未解决（步骤2未成功且不在Pool - done中），增加深度限制并回到步骤1。

solve iter pool过程 ：
1. 重复以下操作：
  1. 对于Pool - todo中的所有目标。
  2. 对于组合理论中的所有理论。
  3. 调用solve NOP(Theory, Goal)，但不递归调用solve iter pool。
  4. 如果目标解决，则将其从Pool - todo移动到Pool - done（连同其证明）。
2. 直到Pool - todo没有变化且Pool - done没有新文字。

底层证明器在有深度限制的情况下总是会终止，并且对于Horn理论是正确和完备的。因此，不调用solve iter pool的solve NOP过程也会终止，而solve iter pool过程也必然会终止，因为共享变量的数量是有限的，池的状态也是有限的。由此可以得出，对于给定的深度限制，solve NOP（包括对solve iter pool的递归调用）会终止。

下面是solve NOP和solve iter pool过程的关系流程图：

graph TD;
    A[solve NOP(Thy, Goal)] --> B{是否是共享变量等式};
    B -- 是 --> C{是否在Pool - done中};
    C -- 是 --> D[子目标已解决];
    C -- 否 --> E{是否在Pool - todo中};
    E -- 否 --> F[插入Pool - todo并调用solve iter pool];
    E -- 是 --> F;
    B -- 否 --> G[使用底层证明器尝试证明];
    G --> H{是否证明成功};
    H -- 是 --> D;
    H -- 否 --> I[增加深度限制，回到步骤1];
    F --> J[solve iter pool];
    J --> K{是否有目标解决};
    K -- 是 --> L[将目标从Pool - todo移到Pool - done];
    K -- 否 --> M[检查Pool状态是否变化];
    M -- 是 --> J;
    M -- 否 --> N[结束];

实验结果表明，在结构化规范中进行定理证明时，即使单独理论的定理证明器没有特别调整，保持结构也能带来好处。以下是实验结果的表格：
| 任务编号 | solve NOP（时间） | solve NOP（推理次数） | solve NOP（数据库命中次数） | 扁平化（时间） | 扁平化（推理次数） | 扁平化（数据库命中次数） |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| 1 | 24 | 1625 | 7827 | 20 | 129 | 3483 |
| 2 | 314 | 7343 | 57064 | 1200* | 4701 | 63557 |
| 3 | 35 | 2237 | 9293 | 105 | 1409 | 14917 |

注：* 表示由于达到时间限制，计算被中止。

从表中可以看出，在所有情况下，扁平化输入的推理次数较少。但对于较难的任务（2、3），solve NOP在时间和数据库命中次数方面表现更好。这是因为solve NOP对项（和文字）有语法限制，混合项和包含不同理论函数符号的文字可能无法形成，从而限制了搜索空间和缓存大小。

自动化定理证明中的理论组合技术解析

非Horn理论的处理

上述的 solve NOP 算法可以扩展以处理非 Horn 理论。可以将其与模型消除方法（或其变体重启模型消除）相结合，从而使其对于任何具有不相交签名的一阶无量词理论的组合都是完备的。

扩展的基本思想是将等式与其祖先集一起存储在池中。由祖先形成的目标上下文可用于执行归约步骤，从而将 SLD 推理机制扩展为完备的。由于篇幅限制，这里不详细描述该方法。

实验结果分析

为了验证算法的有效性，进行了多项实验。实验使用 Prolog 实现了基于之前所述思想的证明器，该证明器借鉴了 Prolog 技术定理证明器的思想并采用了缓存技术。

实验选取了形式方法领域的示例，证明了数据结构（如列表或数组）与描述线性算术以及未解释函数和谓词符号的等式的理论相结合的规范中的一些陈述。下面以任务 2 为例，要证明的陈述为：
((x \leq y \wedge y \leq x + Head([0; x]) \wedge P(f(x) - f(y))) \Rightarrow P(0))
其中 (P) 和 (f) 是未解释的函数符号，(Head) 表示列表的头元素。

将结构化方法与扁平化方法进行了比较，扁平化方法是将所有组合理论的公理组合成一个最终理论。实验结果总结在以下表格中：

任务编号	solve NOP（时间）	solve NOP（推理次数）	solve NOP（数据库命中次数）	扁平化（时间）	扁平化（推理次数）	扁平化（数据库命中次数）
1	24	1625	7827	20	129	3483
2	314	7343	57064	1200*	4701	63557
3	35	2237	9293	105	1409	14917

注：* 表示由于达到时间限制，计算被中止。

从表格数据可以得出以下结论：
- 推理次数方面 ：在所有情况下，扁平化形式的输入推理次数更少。这是因为使用池时，等式会在不同理论中反复尝试求解。
- 时间和数据库命中次数方面 ：对于较难的任务（任务 2 和任务 3），solve NOP 在时间和数据库命中次数上表现更好。原因在于 solve NOP 对项（和文字）有语法限制，混合项和包含不同理论函数符号的文字可能无法形成，从而限制了搜索空间和缓存大小，减少了不必要的计算和数据库访问。

以下是实验结果的分析流程图：

graph TD;
    A[实验任务] --> B[solve NOP方法];
    A --> C[扁平化方法];
    B --> D[记录时间、推理次数、数据库命中次数];
    C --> D;
    D --> E[对比结果];
    E --> F{推理次数：扁平化少?};
    F -- 是 --> G{时间和命中次数：solve NOP优?};
    G -- 是 --> H[得出结论：solve NOP对难任务更优];
    G -- 否 --> I[进一步分析原因];
    F -- 否 --> I;