do
演算
”合法“的do表达式变换:
-
规则1:如果我们观察到变量
W
与Y
无关(其前提可能是以其他变量Z
为条件),那么Y
的概率分布就不会随W
而改变。即
P ( Y ∣ d o ( X ) , Z , W ) = P ( Y ∣ d o ( X ) , Z ) P(Y|do(X), Z, W) = P(Y|do(X), Z) P(Y∣do(X),Z,W)=P(Y∣do(X),Z)
上述等式成立的条件是,在我们删除了指向X
的所有箭头后,变量集Z
会阻断所有从W
到Y
的路径。在“火灾→烟雾→警报”的例子中,
W
=火灾,Z
=烟雾,Y
=警报,Z
阻断了所有从W
到Y
的路径(此例中没有变量X
)。 -
规则2:如果变量集
Z
阻断了从X
到Y
的所有后门路径,那么以Z
为条件(对Z
进行变量控制),则do(X)
等同于see(X)
。即,如果Z
满足后门标准,这种变换就可以写作:
P ( Y ∣ d o ( X ) , Z ) = P ( Y ∣ X , Z ) P(Y|do(X), Z) = P(Y|X, Z) P(Y∣do(X),Z)=P(Y∣X,Z)
这个等式的意思就是,在控制了一个充分的去混因子集之后,留下的相关性就是真正的因果效应。 -
规则3:如果从
X
到Y
没有因果路径,我们就可以将do(X)
从P(Y|do(X))
中移除。即,如果不存在只包含前向箭头的从X
到Y
的路径,则:
P ( Y ∣ d o ( X ) ) = P ( Y ) P(Y|do(X)) = P(Y) P(Y∣do(X))=P(Y)
这个规则可以这样解释:如果我们实施的干预行动(do
)不会影响Y
,那么Y
的概率分布就不会改变。