可解释的无监督异常检测与PC算法中CI测试数量的减少
1. ED - PC与PC算法在CI测试数量上的对比
在研究因果结构学习时,PC算法是常用的方法,但它在条件独立性(CI)测试数量上可能存在优化空间。ED - PC算法通过广泛利用低阶独立性,在算法执行过程中能够更早地移除边,从而减少CI测试的数量。
以下是ED - PC和PC算法在不同网络中的表现对比:
|网络类型|顶点数量|边的数量|平均节点度|ED - PC与PC测试数量对比|
| ---- | ---- | ---- | ---- | ---- |
|water| - | - | - |在l = 2和l = 3阶时,ED - PC测试数量显著少于PC|
|win95pts| - | - | - |在l = 2和l = 3阶时,ED - PC测试数量显著少于PC|
|随机图(ER)| - | - | - |ED - PC常比PC少用一半的测试数量|
从数据中可以看出,在许多图上,ED - PC能够更早地检测到非邻接关系。随着阶数l的增加,两种算法都会收敛到真实骨架,此时执行的CI测试数量非常相似。但在高阶时,即使已经学习到真实骨架,算法仍可能继续搜索更多独立性。我们可以用垂直红线标记出从该点开始不再检测到新独立性的位置。为了充分利用ED - PC改进的非邻接检测能力,在实际应用中可以将其与早期终止方法相结合。
下面是一个简单的mermaid流程图,展示ED - PC和PC算法在不同阶段的大致情况:
graph LR
A[开始] --> B[低阶阶段]