【因果推断与机器学习】Causal Inference:Chapter_4_instrument_variables

本文介绍了工具变量法的基本原理及其在因果效应识别中的应用。通过图形假设和do-calculus,我们探讨了如何使用工具变量来估计不可观测混杂因素影响下的因果效应。同时,文章讨论了工具变量法的推广及不同应用场景。

Instrument Variables

Introduction

我们在因果识别中的目标是找到一种方法,用可观察的统计关系来表达两个特征之间的因果关系。在许多情况下,我们可以使用图形假设和do-calculus来理清我们对统计关系的观察,以确定因果关系。在图形假设不充分的情况下,参数假设有时会有所帮助。考虑一种情况该情况的假设因果图如下所示:


图1 工具变量的例子,变量Z可以帮助识别P(B|A)

在图1中的例子中如果我们希望确定 P(B∣do(A))P(B|do(A))P(Bdo(A)) ,也就是判断事件A(或变量A)对变量B的影响,我们可以得出调整公式是不适合用于这种混杂变量是未被观察到的情况的,又因为变量A和变量B之间又没有中间变量,我们也不能运用前门路径法则。实际上,根据因果图的假设我们是不能判断识别变量A对变量B的因果效应的。

这种因果图挺常见的。例如,我们经常处于这样的情况,我们有能力进行部分随机化的实验,我们可以随机化 变量Z,但不直接控制变量 A 这是我们的主要关注点。这可能发生在对人的实验中,例如,我们可能通过推荐、鼓励或奖励来影响个人的决定,但在其他方面没有完全的控制权。这也可能发生在许多自然环境中,其中包括一些可观察到的独立因素,如天气,在决定变量A中起到部分作用。

然而,这边有个有趣的例子,变量Z对变量A的影响。因为变量Z被变量A给d分离了,我们就可以很容易的识别出Pr(A∣do(Z))=Pr(A∣Z)Pr(A|do(Z))=Pr(A|Z)Pr(Ado(Z))=Pr(AZ),同样的我们也可以看出Pr(B∣do(Z))=Pr(B∣do(Z))Pr(B|do(Z))=Pr(B|do(Z))Pr(Bdo(Z))=Pr(Bdo(Z))

工具变量法是一种因果效应识别方法,遵循图6的图形结构的变量被称为辅助变量。工具变量设置满足几个标准:

  • Z和B是独立的,更正式的来说,Z和B在图Gnull(A)G_{null(A)}Gnull(A)中是d分离的。这意味着Z只能通过变量A的路径来影响B,而且由于共同原因A和B并不相关!
  • Z影响A,而且A和Z并不是d分离的因为P(A∣do(Z))P(A|do(Z))P(Ado(Z))是可识别的。
  • 相对于未观测变量U,Z对A和A对B的影响是均匀的。

前两个条件可以从因果图中读取,而第三个条件是附加的参数约束。第一个条件确保了无论Z对B有什么影响,它只能通过A。Z对Y不可能有不通过A的直接影响。此外,Gnull(A)G_{null(A)}Gnull(A)中Z和B的d分离意味着Z独立于A的未观察混杂U→BU\rightarrow BUB
第二个条件说明Z对a有非零的影响,并且这种影响是可识别的。直观地说,Z对B的影响可以被认为是Z对A的影响和A对B的作用的组合,因此,如果Z对A没有影响,它就不会给我们提供关于A的有用信息。
最后一个条件是,假设Z对A的影响是同质的(即,U不修改Z对B的影响),而A对B的效果也是均匀的(U不修改A对B影响)是合理的。这将使我们能够确保我们对Z对A的影响以及Z对B的间接影响的观察不会与未观察到的因素U的任何相互作用纠缠在一起。
接下来,我们将展示如何使用这两个已识别的成分和上述假设P(B∣Z)P(B|Z)P(BZ)P(A∣Z)P(A|Z)P(AZ)来识别干预A对Z的影响。

连续变量情况下的推导

这里给出一个简单的推导,在图1中变量Z,B和变量A是连续的,如何根据dBdZ\frac{dB}{dZ}dZdBdAdZ\frac{dA}{dZ}

【干货书】《因果推理导论-机器学习角度》,132页pdf 有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。 统计因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。 识别评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。 介入观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。 假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。
评论 7
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值