无因果充分性的发现算法
1 引言
在实际的数据集中,我们几乎总是无法测量所有变量的原因,常常会遗漏那些影响多个测量变量的共同原因。未测量变量的存在,无论是在实验研究还是非实验研究中,都可能导致对测量变量之间因果关系的错误判断,以及对政策效果的错误预测。
目前,检测未测量共同原因的统计方法主要在心理测量学中得到发展。例如,Charles Spearman在1904年提出的消失四分体差异,用于检测潜在变量,但这些标准即使在线性假设下也并非必要或充分条件。流行病学中,美国卫生局局长关于吸烟与健康的报告(1964年)引入的标准,用于判断风险因素与疾病之间的统计依赖是否为“因果关系”,但这些标准存在诸多问题,即使在因果充分的系统中,也无法有效区分原因和相关变量,更无法应对未测量的“混杂因素”问题。
我们的目标是系统地阐述未测量共同原因如何误导研究者对测量变量之间因果关系的判断,以及如何检测未测量共同原因的存在。在假设马尔可夫条件和忠实性条件的前提下,展示如何从适当的样本数据中做出可靠的因果推断,而无需事先了解测量变量系统是否具有因果充分性。
2 PC算法与潜在变量
一个自然的想法是,对PC算法进行轻微修改,使其即使在可能存在未测量变量的情况下,也能提供关于因果结构的正确信息。
2.1 修改后的PC算法
- 步骤A :在顶点集V上形成完整的无向图C。
- 步骤B :
- 初始化n = 0。
- 重复以下操作:
超级会员免费看
订阅专栏 解锁全文
933

被折叠的 条评论
为什么被折叠?



