预测的理论与实践:从观测到干预效果的推断
1. 引言
许多实证研究的根本目标是预测变化的影响,这些变化可能自然发生,也可能由政策干预导致。例如,减少环境铅源是否会提高受影响地区儿童的智力?提高香烟税是否会降低肺癌发病率?这些影响的程度有多大?不同的种植选择、疫苗接种策略、假释政策、戒烟帮助以及汽油税调整等会带来怎样的差异?
随机试验等实验设计试图创建样本,使其从统计角度来看,就像是对应治疗成为普遍政策并在各地实施后所产生的分布。在这种假设下的实验中,统计推断问题是常规的,但在社会科学、流行病学、经济学等领域的实证研究中,我们往往无法确定观察样本是否来自政策实施后会产生的分布。政策实施可能会以未在观察样本中体现的方式改变相关变量。因此,统计推断的一个基本问题是,何时以及如何从被动观察或准实验操作得到的样本推断出政策实施后的分布。
2. 预测问题的分类
预测的可能性可以在多种不同情况下进行分析,主要包括以下几种情况:
2.1 情况1
我们已知因果图、直接操纵的变量以及这些操纵对变量的影响,想要预测未被直接操纵的变量的分布。在这种情况下,因果图和操纵定理可以根据未操纵分布的边际条件概率计算出操纵后的分布,进而得到我们所需的变量分布。
2.2 情况2
我们知道直接操纵的变量集合、操纵分布中的条件概率,且操纵总体中变量的父节点是未操纵总体中父节点的子集,同时测量变量具有因果充分性,但不知道因果图。此时,需要从样本数据推测因果图,样本和PC(或其他)算法可以确定一个代表有向图类的模式,该类的属性决定了直接操纵变量后其他变量分布的可预测性。
超级会员免费看
订阅专栏 解锁全文
820

被折叠的 条评论
为什么被折叠?



