贝叶斯网络:原理、推理模式与实际应用
1. 学生示例模型
1.1 模型概述
在一个稍复杂的场景中,学生的成绩不仅取决于其智力,还与课程难度有关。这里涉及五个随机变量:学生的智力(I)、课程难度(D)、成绩(G)、SAT 分数(S)和推荐信质量(L)。除成绩 G 为三值变量外,其余变量均为二值变量,联合分布有 48 个条目。
贝叶斯网络用有向图表示,节点代表随机变量,边表示变量间的直接影响。图 3.3 展示了该场景下最自然的网络结构,其边体现了现实世界的运作逻辑:课程难度和学生智力独立确定,且先于模型中的其他变量;学生成绩取决于这两个因素;SAT 分数仅依赖于智力;推荐信质量仅取决于成绩。
1.2 局部概率模型
贝叶斯网络的另一组成部分是局部概率模型,用于描述每个变量与其父节点的依赖关系。例如,P(I) 表示聪明和不太聪明学生在总体中的分布,P(D) 表示困难和容易课程的分布。学生成绩的分布是条件分布 P(G | I, D),针对不同的智力和课程难度组合,有不同的成绩分布。每个变量 X 都关联一个条件概率分布(CPD),对于无父节点的节点,CPD 变为边缘分布,如 P(D) 或 P(I)。图 3.4 展示了该领域一种可能的 CPD 选择,网络结构和 CPD 共同构成贝叶斯网络 Bstudent。
1.3 联合分布计算
通过贝叶斯网络的数据结构可指定联合分布。以状态 i1, d0, g2, s1, l0 为例,其概率可由组成它的基本事件概率计算得出:
[P(i1, d0, g2, s1, l0) = P(i1)P(d0)P(g2 | i1, d0)P(s1 | i1)P(l0 | g2) = 0.3 \
超级会员免费看
订阅专栏 解锁全文
237

被折叠的 条评论
为什么被折叠?



