【机器学习模型详细推导5】-朴素贝叶斯分类

最新推荐文章于 2024-12-11 19:50:34 发布

Kevin亓(Qi)

最新推荐文章于 2024-12-11 19:50:34 发布

阅读量2.5k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：机器学习模型详细推导文章标签：朴素贝叶斯机器学习后验概率统计学习方法条件独立假设

本文链接：https://blog.youkuaiyun.com/KevinBetterQ/article/details/84500964

机器学习模型详细推导专栏收录该内容

6 篇文章

订阅专栏

本文详细介绍了朴素贝叶斯分类器的工作原理，包括条件独立假设、先验概率与后验概率的概念，并通过算法推导解释了如何计算后验概率以进行分类。同时，讨论了朴素贝叶斯法在降低分类复杂性的同时可能牺牲的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一. 朴素贝叶斯分类介绍

首先，对于更定数据集 ${ (x_1,y_1),(x_2,y_2),…,(x_m,y_m) \}$ ，可以得到 $P (X ∣ Y)$ 和 $P (Y)$ 的估计；（基于特征条件独立假设和先验概率）
然后，利用 $P (X, Y) = P (X ∣ Y) P (Y)$ 可以学习联合概率分布；
最后，对于确定的 $x$ ，通过比较不同 $y$ 值的 $\frac{P(x,y)}{P(x)}$ 的大小，得到最大的 $P$ 所对应的 $y$ 即为输出 $y$ 值。（比较后验概率）

这里有必要解释一下先验概率和后验概率：
1、先验概率：统计概率，通过历史的数据统计出的事情发生的概率
2、后验概率：条件概率，当下由因及国的概率
例子：
先验——根据若干年的统计（经验）或者气候（常识），某地方下雨的概率；
后验——根据天上有乌云（原因或者证据/观察数据），下雨（结果）的概率；
3、似然：是根据已知结果去推测固有性质的可能性，是对固有性质的拟合程度。在乎的是 x 和 y 的搞演习，拟合程度，所以不能称为概率，为似然函数。
似然——下雨（果）的时候有乌云（因/证据/观察的数据）的概率，即已经有了果，对证据发生的可能性描述；

二. 算法推导详解

1、朴素贝叶斯法利用贝叶斯定理和学到的联合概率模型进行分类预测：
其实就是一个公式（求解后验概率分布）：
$\frac{P(X,Y)}{P(X)}$

$P (X, Y)$ ：通过训练数据学习获得，第2节介绍
$P (X)$ ：因为模型最终根据输入 X 的分类是通过比较不同输出 y 的 P(Y|X) 大小来确定。而对于相同的 X ，其 P(X) 是确定的，对于大小比较没有影响，所以 P(X) 就不需要计算了。

所以，朴素贝叶斯分类模型（非最终版）：
$\; {max}_{c_k} \; P(X=x,Y=c_k)$
样本数据用于训练联合概率分布 $P (X, Y)$ ，模型做的就是将输入 x 分到后验概率最大的类 y 。

2、如何训练得到联合概率分布 P(X,Y)：
$P (X, Y) = P (Y) P (X ∣ Y)$ 1）P(X|Y)计算过程：
朴素贝叶斯的基本假设是条件独立性，称为 特征条件独立性假设：
$\begin {aligned} P(X=x|Y=c_k) &= P(X^{(1)}=x^{(1)},…,X^{(n)}=x^{(n)}|Y=c_k)\\ &=\prod_{j=1}^{n}P(X^{(j)}=x^{(j)}|Y=c_k) \end {aligned}$