自动有限不可满足性推理与饱和模型构建的可判定性研究
1. 相关问题与整体结果
在创建评估问题集时,从2008年4月的TPTP中的所有问题入手。排除了已被确定为不可满足的问题,因为根据定义,这些问题是有限不可满足的;也排除了被确定为定理的问题,因为它们的否定是不可满足的,因此没有反模型。在实验评估中,还排除了已知有有限模型的可满足问题和已知有有限反模型的反可满足问题,但内部使用这些问题来测试正确性。
剩余的1272个问题分类如下:
| 问题类型 | 数量 |
| ---- | ---- |
| 开放问题(抽象问题从未被解决) | 27 |
| 未知问题(ATP系统从未解决过的问题) | 1075 |
| 可满足问题(存在公理的模型,但无已知有限模型) | 122 |
| 反可满足问题(存在猜想否定的模型,但无已知有限反模型) | 48 |
实验在2x双核、1GHz处理器上进行,每个证明方法和问题的超时时间为15分钟,每次调用E和Paradox的超时时间为2秒。Infinox将1272个测试问题中的413个分类为有限不可满足,成功率至少为32%,具体分类成功率如下:
| 问题类型 | 成功分类数量(总数) |
| ---- | ---- |
| 未知问题 | 388(1075) |
| 开放问题 | 3(27) |
| 可满足问题 | 21(122) |
| 反可满足问题 | 1(48) |
2. 方法比较
由于没有与Infinox类似的工具,所以比较不同方法的性能。不仅关注方法成功测试的总数,还关注该方法对整体结果的贡献
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



