机器学习进阶（七）贝叶斯网络

Little Yueyue

已于 2025-05-16 17:43:32 修改

阅读量347

点赞数

分类专栏：菜鸟入门倒计时文章标签：机器学习

于 2021-05-05 15:42:16 首次发布

本文链接：https://blog.youkuaiyun.com/little_yueyue/article/details/116404140

版权

菜鸟入门倒计时专栏收录该内容

40 篇文章

订阅专栏

本文深入探讨了朴素贝叶斯理论，包括高斯朴素贝叶斯和多项式朴素贝叶斯，并介绍了贝叶斯网络的概念，强调了条件独立在贝叶斯网络中的作用，通过tail-to-tail、head-to-tail和head-to-head三种情况说明了如何判断变量间的独立性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

朴素贝叶斯
贝叶斯网络
- 叶斯网络判定条件独立

朴素贝叶斯

朴素贝叶斯的假设：对于给定分类的条件下，特征独立——每个特征同等重要(特征均衡性)，即
$P\left(x_{i} \mid y, x_{1}, \cdots, x_{i-1}, x_{i+1}, \cdots, x_{n}\right)=P\left(x_{i} \mid y\right)$
由贝叶斯公式，可得
$P\left(y \mid x_{1}, x_{2}, \cdots, x_{n}\right)=\frac{P(y) P\left(x_{1}, x_{2}, \cdots, x_{n} \mid y\right)}{P\left(x_{1}, x_{2}, \cdots, x_{n}\right)}=\frac{P(y) \prod_{i=1}^{n} P\left(x_{i} \mid y\right)}{P\left(x_{1}, x_{2}, \cdots, x_{n}\right)}$
在给定样本的前提下, $P\left(x_{1}, x_{2}, \cdots, x_{n}\right)$ 是常数:
$P\left(y \mid x_{1}, x_{2}, \cdots, x_{n}\right) \propto P(y) \prod_{i=1}^{n} P\left(x_{i} \mid y\right)$
从而，
$\hat{y}=\underset{y}{\arg \max } P\left(y \mid x_{1}, x_{2}, \cdots, x_{n}\right) =\underset{y}{\arg \max }P(y) \prod_{i=1}^{n} P\left(x_{i} \mid y\right)$
其中，对 $P\left(x_{i} \mid y\right)$ 服从什么分布的假设不同，则有了高斯朴素贝叶斯，多项式朴素贝叶斯等等。

高斯朴素贝叶斯GaussianNB（连续）

假设某个特征服从高斯分布，即
$P\left(x_{i} \mid y\right)=\frac{1}{\sqrt{2\pi}\sigma_y}\exp \left(-\frac{(x_i-\mu_y)^2}{2\sigma_y^2}\right)$
参数可通过MLE计算

多项分布朴素贝叶斯MultinomialNB（离散）

假设某个特征服从多项式分布，即对于整体每个类别y，参数为 $\theta_y=(\theta_{y1},\theta_{y2},\dots,\theta_{yp})$ ，其中 $p$ 为该特征的属性数，则
$P\left(x_{i}=i \mid y\right)=\theta_{yi}$
用MLE估算参数 $\theta_y$ 的结果为：
$\hat{\theta}_{yi}=\frac{N_{yi}+\alpha}{N_y+\alpha n},N_{yi}=\sum I_{\{x_i=i\}},N_y=n$

$\alpha=0$ 时，为经典MLE, $\alpha=1$ 时，为laplace平滑， $\alpha <1$ 时，为lidstone平滑， $\alpha \not= 0$ 可以解释为防止过拟合

生成模型

过程考虑 $P\left(x_{i} \mid y\right)$ 属于什么分布 $\rightarrow$ 生成模型
过程考虑 $P\left(y \mid x_i\right)$ 属于什么分布 $\rightarrow$ 判别模型

贝叶斯网络

把某个研究系统中涉及的随机变量，根据是否条件独立绘制在一个有向图中，就形成了贝叶斯网络。
贝叶斯网络(Bayesian Network)，又称有向无环图模型（无环，即不能存在这样的路径：从某个结点开始，沿着链接中箭头的⽅向运动，结束点为起点。），是一种概率图模型，根据概率图的拓扑结构，考察一组随机变量 $X_1,X_2...X_n$ 及其 $n$ 组条件概率分布的性质。

贝叶斯网络举例：
下图可写成 $p (a, b, c) = p (c ∣ a, b) p (b ∣ a) p (a)$
在这里插入图片描述

而朴素贝叶斯的这种假设 $P\left(x_{1}, x_{2}, \cdots, x_{n}|y\right) = \prod_{i=1}^{n} P\left(x_{i} \mid y\right)$ ,相当于下图， $x_1,x_2,\dots,x_n$ 之间没有连接。
在这里插入图片描述

下图 $x_1,x_2,\dots,x_7$ 的联合分布：
$p(x_1)p(x_2)p(x_3)p(x_4|x_1,x_2,x_3)p(x_5|x_1,x_3)p(x_6|x_4)p(x_7|x_4,x_5)$
在这里插入图片描述
全部随机变量变量的联合分布为：
$p(x_1,x_2,\dots,x_n)=\prod_{i=1}^n p(x_i|parents(x_i)）$

叶斯网络判定条件独立

下述结论可从结点推广到结点集

tail-to-tail

在这里插入图片描述
$\begin{aligned} P(a,b,c)&=P(c)*P(a|c)*P(b|c)\\ \frac{P(a,b,c)}{P(c)}&=P(a|c)*P(b|c)\\ P(a,b|c)&=P(a|c)*P(b|c) \end{aligned}$
在 $c$ 给定的条件下， $a, b$ 被阻断(blocked)，是独立的。

head-to-tail

在这里插入图片描述
$\begin{aligned} P(a,b|c)&=\frac{P(a)*P(c|a)*P(b|c)}{P(c)}\\ P(a,b|c)&=P(a|c)*P(b|c)\\ \end{aligned}$
在 $c$ 给定的条件下， $a, b$ 被阻断(blocked)，是独立的。