机器学习与因果推断
Chapter 1:the introduction of Causal Reasoning
Introduction
机器学习算法越来越多的被应用到生活的方方面面,其中很大一部分学者尝试应用在医疗、教育、管理、金融和农业等社会关键领域。然而在这些领域基于机器学习而做出的判断或者决策会产生广泛的影响。这意味着,如果想要真正的理解(机器学习)系统所做出的判断或者决策,必须要抓住其本质。对所做出的决策还需要了解到决策的副作用和直接影响。与传统的机器学习模型不同的是,因果推断可以解决我们对因果关系以及因和果之间 的耦合问题。以及我们如何从一个因果关系的角度来解释纯粹的预测问题,这足以让我们从因果推论中使我们的机器学习模型获益。
那么,在这里举几个非常经典的例子来非正式的介绍因果推理的研究内容。such as:(1)事件A 是事件B发生的原因么?(2)向用户推荐产品是否会让他们更愿意购买?if so,what the probability could be?(3)什么样的原因会驱使一个人去偿还贷款或者他会做一个好雇员或者好老板?(4)如果天气变热,庄稼会枯萎么?and what we talked above is just the Causal Reasoning did.
What is Causal Reasoning?
因果推理是科学探究的一个组成部分,从古希腊哲学开始就有着悠久的历史。从生物医学到社会科学等领域都依赖因果推理来评估理论,并回答关于我们居住的物理和社会世界的实质性问题。And here we quote Gary King’s words
“More has been learned about causal inference in the last few decades than the sum total of everything that had been learned about it in all prior recorded history”.
“在过去的几十年里,人们对因果推理的了解超过了以往所有有记录的历史中关于因果推理的所有知识的总和”。
紧接着有人可能会疑惑为什么因果推理是如此的crucial,为什么他没有成为类似概率论或者贝叶斯理论一样的常见的数学表达形式。这就让人们想起来了那句话百因必有果,你的报应就是我,事实上这些因果论的论调总是模糊的,许多哲学家至今也未达成共识。(至于为什么你可以类比想想自己小时候为什么没考好,然后总是有各种各样的理由搪塞)
面对你为什么小时候没考好这种难度极大的哲学问题,现代因果推理的进步不是通过直接回答这些问题,而是通过创造灵活的方法来推理因果之间的关系,而不考虑人们选择的抽象概念。本文中的Causal Reasoning避开哲学上的模糊,采用一种更简单实用的方法进行因果推理,即所谓的干涉主义来定义因果关系。
Defining Causation
definition
在干涉主义者的因果论定义中,在保持其他一切不变的情况下,如果我们在改变A之后观察到B的值有所不同,那么一个事件A引起了另一个事件B。
由于因果推理早期在医学上的应用(我们将在第三章讨论),习惯上称A为“治疗”或简称为原因。b被称为“结果”。熟悉强化学习的读者可能会把A比作“动作”,把B比作“奖励”。一般来说,这些事件与定量描述它们的测量变量相关联,例如,治疗药物的剂量及其在血压方面的结果,我们分别将其称为治疗变量和结果变量。为了方便起见,我们可以互换使用事件及其测量变量,但重要的是要记住,因果关系是根据事件定义的,相同的事件在不同的测量中可以对应不同的变量。
Interventions and Counterfactuals
在这里需要进一步解释的词语是改变A和保持其他一切不变的情况下。这些分别对应于因果推理中的两个关键概念:干预和反事实推理。干预指的是主动改变治疗变量的任何动作,例如给病人吃药,改变用户网站界面、给某人贷款等等。
intervention: 改变治疗变量T的主动行为。
然而,为了获得对其效果的有效解释,必须在“保持其他一切不变”的情况下进行干预。也就是说,仅仅采取行动是不够的,还要确保其他相关因素都没有改变,这样我们才能隔离干预的影响。继续我们的例子,评估一个新特性的效果,仅仅指派人去尝试它是不够的,还要确保没有其他系统组件同时改变。从自然科学的早期实验来看,这种干预被称为“受控”实验,我们限制某些变量的值,以隔离干预的影响。
虽然“控制”或保持其他变量不变是直观的,但不清楚包括哪些变量。利用因果推理的第二个关键概念,反事实,我们可以得到一个更精确的定义。这个想法是比较干预后发生的事情和没有干预会发生的事情。也就是说,对于任何干预,我们可以想象两个世界,在任何方面都是相同的,直到某个“治疗”发生在一个世界而没有发生在另一个世界。这两个世界的任何随后的差异都是这种处理的逻辑结果。第一个是观察到的事实世界,而第二个是未观察到的反事实世界(conunterfactuals反事实这个词的意思是“与事实相反”)。
Counterfactual Value:在没有发生的事件下变量的(假设)值。
将反事实和干预(治疗变量)放在一起,干预的因果效应定义为干预后观察到的结果和没有干预时的反事实结果之间的差异。
事实世界下的结果表达为YWorld1(T=1)Y_{World1(T=1)}YWorld1(T=1)
在反事实的情况下结果表达式为YWorld2(T=0)Y_{World2(T=0)}YWorld2(T=0)
因果效应可以完美的表达为:

最低0.47元/天 解锁文章
1223

被折叠的 条评论
为什么被折叠?



