减少PC算法中条件独立性测试次数的方法
1. 引言
PC算法是一种从观测数据中学习因果结构的流行且广泛使用的基于约束的方法。为了估计结构的骨架,该算法需要评估大量的条件独立性(CI)。算法在后续阶段的决策基于这些CI测试。因此,在以通用形式实现该算法时,一项关键任务是提供快速可靠的统计测试来确定CI。
然而,CI测试比无条件独立性估计困难得多,并且仍然是一个正在进行的研究课题。特别是在存在高阶独立性的情况下,CI测试仍然是一项具有挑战性的任务。许多作者在假设特定分布模型的情况下研究了通用PC算法的实现。
在本文的研究中,不做这样的假设,而是研究具有对CI语句的神谕访问的基本PC算法。目标是开发该算法的一种修改版本,能够以更高效的方式使用CI测试来推断真实的因果结构。
PC算法由三个阶段组成:
1. 使用阶数为l = 0, 1, 2, …的CI测试,学习骨架并估计分离集。
2. 使用分离集,对骨架中的v结构进行定向,得到一个模式。
3. 使用Meek规则对模式的其余边进行定向,产生最终结构。
例如,对于由图1(a)中真实有向无环图(DAG)中的d分离诱导的给定CI语句,图1(b)展示了PC算法在第一阶段完成阶数为l = 0和l = 1的所有CI测试时学习到的结构。在接下来的迭代中,当l = 2时,算法在检测到(a ⊥⊥b | c, d)后移除边a - b。在第二阶段,计算模式,并且由于最终阶段没有规则可以应用,模式与真实结构一致。
提出了一种PC算法的修改版本,称为ED - PC(Early Deletion PC),它计算的结构与PC算法相同,但使用了一种新方法,在CI测试阶段就检测v结构。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



