条件独立性、图与d-分离相关知识详解
1. 条件独立性与d-分离基础概念
1.1 d-连接与d-分离定义
若两个变量X和Y不是d-分离的,则称它们是d-连接的。判断一组变量S是否能将集合C与集合D进行d-分离,可按以下步骤操作:
1. 找出所有连接集合C中变量与集合D中变量的路径。
2. 对每条路径进行检查,直到找到一条活跃路径:
- 若路径上存在处于集合S中的链节点或分叉节点,则该路径不活跃。
- 若路径上存在碰撞节点,需检查其后代节点是否在集合S中。若不在,则该路径不活跃。
- 否则,该路径活跃。
3. 若找到活跃路径,则集合C和集合D不能被集合S进行d-分离;若所有路径都不活跃,则它们能被集合S进行d-分离。
1.2 马尔可夫毯定义
当一个变量X的所有父节点、所有子节点以及所有与X共享子节点的变量都被实例化时,X与网络的其余部分是d-分离的。这组变量被称为变量X的马尔可夫毯。例如,在给定的有向无环图(DAG)中,变量X1的马尔可夫毯是节点集合{X2, X3, X4, X6}。设S = {X2, X3, X4, X6},则X1 ⊥X5∥GS。马尔可夫毯在模式识别中的变量选择等算法应用中有着重要作用。
1.3 贝叶斯球方法
贝叶斯球为判断两个节点是否d-分离提供了便捷方法。未实例化(隐藏)的节点用圆圈表示,实例化的节点用方块表示。在DAG中有三种连接类型:链、碰撞和分叉。其规则如下:
|连接类型|节点实例化情况|贝叶斯球移动情况|
| ---- | ---- | ---- |
|链连接|节点实例化|球不能从X1通过X2
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



