李宏毅深度学习笔记（五）分类：概率生成模型(Probabilistic Generative Model)——朴素贝叶斯

本文链接：https://blog.youkuaiyun.com/comli_cn/article/details/102984837

朴素贝叶斯的引入

假设我们有两个盒子，第一个盒子里有大小形状相同的4颗蓝球，1颗绿球；第二个盒子里有大小形状相同的2颗蓝球，3颗绿球。我们从两个盒子里任取一颗球是蓝球，问这颗蓝球从第一个盒子里面取出的概率是多少？
这就是后验概率的问题，根据贝叶斯定理计算如下：

$P(B_1|Blue)=\frac{P(Blue|B_1)P(B_1)}{P(Blue|B_1)+P(Blue|B_2)P(B_2)}$

将上述例子一般化之后就如下图所示：
在这里插入图片描述
若 $x$ 是蓝色，则 $P(x|C_1)=\frac{4}{5}$ , $P(C_1)=\frac{5}{10}=\frac{1}{2}$ , $P(x|C_2)=\frac{2}{5}$ , $P(C_2)=\frac{5}{10}=\frac{1}{2}$

通过上面的推论我们知道了如何求取一个新给的样本属于各个类别的概率，但上面所讲的是在一个封闭的系统（ $x$ 只能从两个盒子里面抽取）里面的概率，且我们可以直接看出两个类别的概率分布。然而，在实际的应用中我们往往没有某一个类别精确的概率分布，我们的训练集也无法穷举所有的可能性，这时候就要求我们对一个类别求取一个最符合它样本分布的概率模型，以便我们在这个概率模型下计算 $P(x|C_i)$ 。

如何求取概率模型

我们先假设数据的概率分布（正态、伯努利、播送、···），然后用概率公式去计算 $x$ 属于的类型 $P(C_1|x)$ 。
一般的，我们假设 $x$ 为高斯分布，这是由概率论中的中心极限定理所得来的。

多维高斯分布：
在这里插入图片描述
其中均值为 $\mu$ ，协方差为 $\sum$
这里举个例子来看一下不同的 $\mu$ 和 $\sum$ 对分布的影响：

接下来就是求取这个假设的分布中的参数 $\mu$ 和 $\sum$ 了，这里用极大似然估计来求取。比如说我们用某个模型生成了下图所示的79个样本点，那么我们的目的就是要求最有可能生成这79个样本点的模型，即求出这个模型的 $\mu$ 和 $\sum$ 。
在这里插入图片描述
这里我们用下面的极大似然估计的函数：