约束满足问题中学习通用约束
1. 引言
约束满足问题(CSP)求解器在求解过程中学习新约束的能力,有可能将运行时间缩短指数倍。然而,与布尔可满足性问题(SAT)求解器不同,由于难以使其具有成本效益,只有少数CSP求解器使用学习机制。
早期的CSP求解器中存在一种有限形式的学习,称为禁值学习(nogood learning)。禁值被定义为无法扩展为完整解的部分赋值。后来,提出了广义禁值(generalized nogoods,简称g - nogoods),它也允许非赋值情况。例如,一个g - nogood (x ↚1, y ←1) 表示x被赋值为除1以外的任何值,且y被赋值为1的赋值无法扩展为解。这种形式便于表示传播器获得的知识。广义禁值可能比禁值强大指数倍。
更通用和简洁的学习知识表示形式是有符号子句。有符号子句是有符号文字的析取,有符号文字的形式为v ∈D 或v ̸∈D(分别称为正有符号文字和负有符号文字),其中v是变量,D是值的域。Beckert等人研究了有符号合取范式(CNF)的可满足性问题,并提出了基于简化规则和有符号子句二元消解规则的推理系统:
((v ∈A) ∨X)
((v ∈B) ∨Y )
(v ∈(A ∩B) ∨X ∨Y )
[Signed Resolution(v)]
其中X和Y由零个或多个文字的析取组成,A和B是值的集合,v称为枢轴变量。当v是布尔变量且A、B是互补的布尔域时,该规则简化为SAT中使用的命题子句的标准消解规则。
本文提出了一种新的CSP求解器学习方案,该方案基于学习(通用)约束,而不是过去使用的广义禁
超级会员免费看
订阅专栏 解锁全文
2036

被折叠的 条评论
为什么被折叠?



