阅读David Salazar的文章Causality: Invariance under Interventions后的笔记
主要内容
在前面的文章中我们已经对基本的因果关系有了认识,下一步是如何将图形表示与数据结合,以完成因果推断。主要内容简而言之,就是使用干涉前观测值的分布中的不变量去估计干涉带来的因果效应。
形式化定义
对于数据间的关联来说,例如 P ( Y ∣ X ) P(Y|X) P(Y∣X),可以是多种联系导致的相同结果。但我们可以说,任何统计学上有意义的关联关系都是因果关系通过某些作用路径导致的结果,但未必就是我们所希望的因果效应(causal effect)。
根据Pearl的定义,如果干涉 X X X(用外生(exogenous)手段改变 X X X的取值)能改变 Y Y Y的值,则 X X X对 Y Y Y有因果效应。表示为将 X X X进行赋值 X : = x X:=x X:=x,则有干涉后分布 P ( Y ∣ d o ( x ) ) P(Y|do(x)) P(Y∣do(x))。 d o do do操作符代表了外生的干涉行为。因此,研究 X X X对 Y Y Y的因果效应就是在系统外改变 X X X的取值,并观察系统内 Y Y Y的变化情况。
因果图与条件概率
接下来,问题就变成了:我们如何去模拟在因果系统中干涉带来的影响?
首先,我们先对因果图进行定义。用节点间的弧表示有直接因果效应,用节点间不存在弧表示不存在因果效应。如下图 G G G。

其次,将因果图与条件概率结合起来。假设图上的每个节点 x x x都条件依赖于其父节点 p a pa pa,并且, x x x独立于那些不把 x x x作为原因的结点(比如, x x x的父节点 z z z独立于 x x x)。那么,因果图就有了与贝叶斯网络相同的联合分布递归分解特性,见式(1)。
P ( x 1 , … , x n ) = ∏ j P ( x j ∣ p a j ) (1) P(x_1,\dots,x_n)=\prod_j P(x_j|pa_j) \tag{1} P(x1,…,xn</

本文探讨了如何利用干涉前观测数据中的不变量来估计因果效应。介绍了因果图与条件概率的结合,干涉操作及其数学表达,以及从观测数据中识别因果效应的方法。
最低0.47元/天 解锁文章
2352

被折叠的 条评论
为什么被折叠?



