购书链接:http://www.ituring.com.cn/book/1780
什么是因果?
本书在开头讲述了一个生动的历史故事(其用来解释关联与因果的区别),1999年,一个律师被误判为谋杀了自己的两个新生儿。其对概率的误用,是由于结果推断原因的错误认识---博士认为两个新生儿的死亡是独立事件,事实上并非如此,当一个新生儿因病死亡后,那么第二个新生儿患此病的概率的远大于第一个。文中因为认为概率实在是太低了,可见不是由于患病的原因还是一场谋杀,可见因果推理并不能仅仅依靠单学科的知识,否则必然会导致冤案。
何为原因?为什么需要原因?如何寻找原因
休谟把因果关系简化为规律,原因即导致该种结果的前提之一。(哲学上存在多因一果、一因多果)。因为人类的实践导致经验主义,如果把经验当成规律,那么有原因的话我们就可以直接预知结果,这也是一种智慧,由此产生决策树思想。为了更好利用因果推理,所以我们要实事求是的寻找原因。 书中从以下几方面入手: 1.感知 2.推理与论证 ( 关联法、反向阻断法、间接腿短发)
因果关系的相关性(Apriori):
- 如果学过机器学习,很容易想到Apriori算法,通过一定属性的布尔关联的出预测值。
- 但因果关系并不一定相关!和书名一样《 别把相关当因果!》
NOTE:没有变化就没有相关性(辨别是否有想关性的依据)
IMPORTANT:没有相关性的因果关系 ->
长跑对体重的影响。虽然长跑能够消耗热量从而减轻体重,但是长跑也能导致食欲大增从而增加体重(而这又会对减肥造成负面影响)。根据每种影响的强度不同,或者根据调查的数据不同,跑步的积极作用可能恰好会被它的消极作用抵消,结果人们就会发现在跑步和减肥之间不存在任何相关性
书评:
这是一本比较薄的科普类小书,旨在对读者说明因果关系和相关性不是同义词。很多时候我们会自认为找到了原因,但实际上我们找到的只是一些相关性而已,甚至这种相关性都是虚假的。
马哲中对原因的阐述是很有深远意义的,一种原因是可以导致多种结果的,所以我们即便是找到了这种原因,也要合理运用。引用机器学习的一个优化法则就是“没有免费的午餐”,对于一种因果在外部环境变化时起可能也会变化。
作者也讲述了几种在没有因果关系情况下发现事物之间的相关性,所谓的“万物皆可大数据”,比如计算法。文中也提到知识,也许一个人不能家财万贯,但我们可以选择读书阅万卷。