因果推理:从牛顿理论到现代方法的探索
在科学研究中,因果推理一直是一个核心话题。牛顿曾表示,他无法从现象中发现引力属性的原因,也不愿对此进行假设。他主张基于从现象中推导出来的简单公理假设和归纳观察,形成数据驱动的解释模型,而不是像莱布尼茨那样从思辨假设出发。如今,科学和商业中发现的许多原因可能就像引力一样,是更深层次机制的代理表现。
实验验证因果效应的优势与局限
实验验证因果效应虽然难以深入理解背后的机制,但具有可重复性高的优势。医学中的元研究表明,通过大型随机对照实验验证的效应大多能够重复,而使用无实验控制的标准数据挖掘方法的研究则很少能重复。因此,经过随机对照实验检验因果推断的解释模型更可靠。然而,在人类行为或医学研究中,随机对照实验往往难以实施,这不仅因为成本高,还因为许多因果变量无法在随机对照研究中进行实验操纵。不过,准实验对于这些变量是可行的,它成本低,且在控制好混杂效应的关键假设下,能生成可靠的解释模型。
倾向得分匹配方法
准实验方法旨在利用观察数据实现类似于随机对照实验的受控比较。匹配设计是其中一种方法,常用于流行病学研究,例如评估吸烟对肺癌的影响。在匹配设计中,会将吸烟者和非吸烟者在可能导致肺癌的所有协变量上进行匹配,然后比较两组患肺癌的倾向。
对于高维数据,通常使用多元倾向得分来反映协变量与结果变量的混淆概率。最流行的倾向得分匹配样本方法基于逐步逻辑回归建模,具体步骤如下:
1. 选取所有可能对最终结果(如肺癌)产生独立因果影响的协变量(如性别、年龄和癌症病史)。
2. 构建一个逐步逻辑回归模型,根据这些协变量预测假定因果/暴露变量(如吸烟状态)的水平。
3. 构建一个独立样本,根据吸烟状
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



