【因果推断与机器学习】Causal Inference: Chapter_1

机器学习与因果推断

Chapter 1:the introduction of Causal Reasoning

Introduction

机器学习算法越来越多的被应用到生活的方方面面,其中很大一部分学者尝试应用在医疗、教育、管理、金融和农业等社会关键领域。然而在这些领域基于机器学习而做出的判断或者决策会产生广泛的影响。这意味着,如果想要真正的理解(机器学习)系统所做出的判断或者决策,必须要抓住其本质。对所做出的决策还需要了解到决策的副作用和直接影响。与传统的机器学习模型不同的是,因果推断可以解决我们对因果关系以及之间 的耦合问题。以及我们如何从一个因果关系的角度来解释纯粹的预测问题,这足以让我们从因果推论中使我们的机器学习模型获益。

那么,在这里举几个非常经典的例子来非正式的介绍因果推理的研究内容。such as:(1)事件A 是事件B发生的原因么?(2)向用户推荐产品是否会让他们更愿意购买?if so,what the probability could be?(3)什么样的原因会驱使一个人去偿还贷款或者他会做一个好雇员或者好老板?(4)如果天气变热,庄稼会枯萎么?and what we talked above is just the Causal Reasoning did.

What is Causal Reasoning?

因果推理是科学探究的一个组成部分,从古希腊哲学开始就有着悠久的历史。从生物医学到社会科学等领域都依赖因果推理来评估理论,并回答关于我们居住的物理和社会世界的实质性问题。And here we quote Gary King’s words

“More has been learned about causal inference in the last few decades than the sum total of everything that had been learned about it in all prior recorded history”.
“在过去的几十年里,人们对因果推理的了解超过了以往所有有记录的历史中关于因果推理的所有知识的总和”。

紧接着有人可能会疑惑为什么因果推理是如此的crucial,为什么他没有成为类似概率论或者贝叶斯理论一样的常见的数学表达形式。这就让人们想起来了那句话百因必有果,你的报应就是我,事实上这些因果论的论调总是模糊的,许多哲学家至今也未达成共识。(至于为什么你可以类比想想自己小时候为什么没考好,然后总是有各种各样的理由搪塞)

面对你为什么小时候没考好这种难度极大的哲学问题,现代因果推理的进步不是通过直接回答这些问题,而是通过创造灵活的方法来推理因果之间的关系,而不考虑人们选择的抽象概念。本文中的Causal Reasoning避开哲学上的模糊,采用一种更简单实用的方法进行因果推理,即所谓的干涉主义来定义因果关系。

Defining Causation

definition

在干涉主义者的因果论定义中,在保持其他一切不变的情况下,如果我们在改变A之后观察到B的值有所不同,那么一个事件A引起了另一个事件B。

由于因果推理早期在医学上的应用(我们将在第三章讨论),习惯上称A为“治疗”或简称为原因。b被称为“结果”。熟悉强化学习的读者可能会把A比作“动作”,把B比作“奖励”。一般来说,这些事件与定量描述它们的测量变量相关联,例如,治疗药物的剂量及其在血压方面的结果,我们分别将其称为治疗变量和结果变量。为了方便起见,我们可以互换使用事件及其测量变量,但重要的是要记住,因果关系是根据事件定义的,相同的事件在不同的测量中可以对应不同的变量。

Interventions and Counterfactuals

在这里需要进一步解释的词语是改变A保持其他一切不变的情况下。这些分别对应于因果推理中的两个关键概念:干预和反事实推理。干预指的是主动改变治疗变量的任何动作,例如给病人吃药,改变用户网站界面、给某人贷款等等。

intervention: 改变治疗变量T的主动行为。
然而,为了获得对其效果的有效解释,必须在“保持其他一切不变”的情况下进行干预。也就是说,仅仅采取行动是不够的,还要确保其他相关因素都没有改变,这样我们才能隔离干预的影响。继续我们的例子,评估一个新特性的效果,仅仅指派人去尝试它是不够的,还要确保没有其他系统组件同时改变。从自然科学的早期实验来看,这种干预被称为“受控”实验,我们限制某些变量的值,以隔离干预的影响。
虽然“控制”或保持其他变量不变是直观的,但不清楚包括哪些变量。利用因果推理的第二个关键概念,反事实,我们可以得到一个更精确的定义。这个想法是比较干预后发生的事情和没有干预会发生的事情。也就是说,对于任何干预,我们可以想象两个世界,在任何方面都是相同的,直到某个“治疗”发生在一个世界而没有发生在另一个世界。这两个世界的任何随后的差异都是这种处理的逻辑结果。第一个是观察到的事实世界,而第二个是未观察到的反事实世界(conunterfactuals反事实这个词的意思是“与事实相反”)。
Counterfactual Value:在没有发生的事件下变量的(假设)值。
将反事实和干预(治疗变量)放在一起,干预的因果效应定义为干预后观察到的结果和没有干预时的反事实结果之间的差异。

事实世界下的结果表达为YWorld1(T=1)Y_{World1(T=1)}YWorld1(T=1)
在反事实的情况下结果表达式为YWorld2(T=0)Y_{World2(T=0)}YWorld2(T=0)
因果效应可以完美的表达为:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值