贝叶斯网络中的因果推理与条件独立性
1. 贝叶斯网络的局限性与扩展
在处理贝叶斯网络(BNs)时,我们需要认识到其在表达独立性陈述方面存在一定的局限性。任何图形模型在独立性表达上都有其限度,这意味着BNs可能并非总是表达独立性假设和直觉的最佳框架。
当对变量进行边缘化处理时,一个自然的做法是使用双向箭头。例如,对于图3.11(a),可以用双向边来描绘其边际分布,如图3.11(b)所示。关于使用双向边扩展BNs的讨论可参考相关资料。
2. 因果关系
因果关系是一个颇具争议的话题。在数据模型中,如果不包含明确的时间信息,那么“因果”这个词就容易引发争议,因为从形式上只能推断出相关性或依赖性。
对于分布p(a, b),我们可以将其写成p(a|b)p(b)或p(b|a)p(a)。在前者中,我们可能会认为b“导致”a;在后者中,可能会认为a“导致”b。但实际上,这两种表示方式代表的是同一个分布。形式上,BNs仅能做出独立性陈述,而非因果陈述。不过,在构建BNs时,从因果关系的角度思考变量之间的依赖关系是有帮助的,因为我们通常更习惯于从一个变量如何“影响”另一个变量的角度去理解。
2.1 辛普森悖论
辛普森悖论是BNs因果推理中的一个警示故事。以一个医学试验为例,进行了两项试验,分别针对40名男性和40名女性,试验数据总结如下表:
| 康复 | 未康复 | 康复率 | |
|---|---|---|---|
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



