Instrument Variables
Introduction
我们在因果识别中的目标是找到一种方法,用可观察的统计关系来表达两个特征之间的因果关系。在许多情况下,我们可以使用图形假设和do-calculus来理清我们对统计关系的观察,以确定因果关系。在图形假设不充分的情况下,参数假设有时会有所帮助。考虑一种情况该情况的假设因果图如下所示:
在图1中的例子中如果我们希望确定 P(B∣do(A))P(B|do(A))P(B∣do(A)) ,也就是判断事件A(或变量A)对变量B的影响,我们可以得出调整公式是不适合用于这种混杂变量是未被观察到的情况的,又因为变量A和变量B之间又没有中间变量,我们也不能运用前门路径法则。实际上,根据因果图的假设我们是不能判断识别变量A对变量B的因果效应的。
这种因果图挺常见的。例如,我们经常处于这样的情况,我们有能力进行部分随机化的实验,我们可以随机化 变量Z,但不直接控制变量 A 这是我们的主要关注点。这可能发生在对人的实验中,例如,我们可能通过推荐、鼓励或奖励来影响个人的决定,但在其他方面没有完全的控制权。这也可能发生在许多自然环境中,其中包括一些可观察到的独立因素,如天气,在决定变量A中起到部分作用。
然而,这边有个有趣的例子,变量Z对变量A的影响。因为变量Z被变量A给d分离了,我们就可以很容易的识别出Pr(A∣do(Z))=Pr(A∣Z)Pr(A|do(Z))=Pr(A|Z)Pr(A∣do(Z))=Pr(A∣Z),同样的我们也可以看出Pr(B∣do(Z))=Pr(B∣do(Z))Pr(B|do(Z))=Pr(B|do(Z))Pr(B∣do(Z))=Pr(B∣do(Z))。
工具变量法是一种因果效应识别方法,遵循图6的图形结构的变量被称为辅助变量。工具变量设置满足几个标准:
- Z和B是独立的,更正式的来说,Z和B在图Gnull(A)G_{null(A)}Gnull(A)中是d分离的。这意味着Z只能通过变量A的路径来影响B,而且由于共同原因A和B并不相关!
- Z影响A,而且A和Z并不是d分离的因为P(A∣do(Z))P(A|do(Z))P(A∣do(Z))是可识别的。
- 相对于未观测变量U,Z对A和A对B的影响是均匀的。
前两个条件可以从因果图中读取,而第三个条件是附加的参数约束。第一个条件确保了无论Z对B有什么影响,它只能通过A。Z对Y不可能有不通过A的直接影响。此外,Gnull(A)G_{null(A)}Gnull(A)中Z和B的d分离意味着Z独立于A的未观察混杂U→BU\rightarrow BU→B。
第二个条件说明Z对a有非零的影响,并且这种影响是可识别的。直观地说,Z对B的影响可以被认为是Z对A的影响和A对B的作用的组合,因此,如果Z对A没有影响,它就不会给我们提供关于A的有用信息。
最后一个条件是,假设Z对A的影响是同质的(即,U不修改Z对B的影响),而A对B的效果也是均匀的(U不修改A对B影响)是合理的。这将使我们能够确保我们对Z对A的影响以及Z对B的间接影响的观察不会与未观察到的因素U的任何相互作用纠缠在一起。
接下来,我们将展示如何使用这两个已识别的成分和上述假设P(B∣Z)P(B|Z)P(B∣Z)和P(A∣Z)P(A|Z)P(A∣Z)来识别干预A对Z的影响。
连续变量情况下的推导
这里给出一个简单的推导,在图1中变量Z,B和变量A是连续的,如何根据dBdZ\frac{dB}{dZ}dZdB和dAdZ\frac{dA}{dZ}

本文介绍了工具变量法的基本原理及其在因果效应识别中的应用。通过图形假设和do-calculus,我们探讨了如何使用工具变量来估计不可观测混杂因素影响下的因果效应。同时,文章讨论了工具变量法的推广及不同应用场景。
最低0.47元/天 解锁文章
6042

被折叠的 条评论
为什么被折叠?



