多元因果模型学习方法综述
在因果关系研究中,准确识别因果结构是一个关键问题。本文将介绍多种用于结构识别的方法,包括独立性基础方法、基于得分的方法、加性噪声模型、已知因果顺序的情况以及结合观测和实验数据的方法。
1. 不变预测假设
关键假设是存在一个未知集合 $PAY \subseteq {1, …, d}$(可视为 $Y$ 的直接原因),使得在所有环境下,给定 $PAY$ 时 $Y$ 的条件分布是不变的,即对于所有 $e, f \in E$,有 $P_{Y^e | PA^e_Y} = P_{Y^f | PA^f_Y}$。
若分布由潜在的结构因果模型(SCM)诱导,且不同环境对应不同的干预分布(其中 $Y$ 未被干预),则该假设成立。不过,此设置更为通用,环境不一定对应干预,甚至不需要潜在的 SCM。
可以考虑所有满足“不变预测”的变量集合 $S \subseteq {1, …, d}$ 的集合 $S$,即对于所有 $e, f \in E$ 和所有 $S \in S$,有 $P_{Y^e | S^e} = P_{Y^f | S^f}$。
不难看出,所有这些集合 $S \in S$ 中出现的变量必定是 $Y$ 的直接原因,即 $\bigcap_{S \in S} S \subseteq PAY$。Peters 等人将此式的左侧作为 $PAY$ 的估计。在 SCM 和干预的特殊情况下,存在一些充分条件使得 $PAY$ 可识别,即上述式子为等式。有趣的是,在后续介绍的方法中,能判断数据是否来自这种可识别的情况,而无需事先假设。
Tian 和 Pearl 也探讨了未知干预目标下的可识别性问题,他们未指定目标变量,而是关注边际分布的
超级会员免费看
订阅专栏 解锁全文
3545

被折叠的 条评论
为什么被折叠?



