在日常生活中,我们常常会用到因果推断。比如
“你淋雨了,赶紧去洗澡,不然容易着凉,感冒”
这里我们认为淋雨是感冒的因,通过原因,来推断可能得结果
“我拉肚子了,可能是昨天海鲜吃多了”
这里我们认为海鲜吃多了是拉肚子的因,并且通过拉肚子反推可能得原因
因果推断遍布生活的方方面面,而在大数据时代,因果推断也在机器学习领域逐渐火了起来。
要学习因果推断,我们必须先学习一些预备知识。
因果性和相关性
首先我们需要区分因果性和相关性。
相关性:一个比较经典的例子,研究发现一个国家消耗巧克力越多,这个国家的诺贝尔奖得主就越多,显然这里反映的是两者的相关性,而没有因果关系。
因果性:进一步分析,我们发现吃巧克力多可能反映的是国家经济水平,国民教育水平等,而这些是诺贝尔奖得主数量的“因”。
因果性往往会反映相关性,也会导致伪相关,这个概念后续会进行介绍
贝叶斯基础知识
学习因果推断,我们需要先了解一些贝叶斯相关的预备知识。
贝叶斯公式