1. 思想
通过贝叶斯公式,计算最大后验MAP
2. 贝叶斯公式
3. 前提假设
朴素贝叶斯之所以称之为"朴素",原因在于它的前提假设是条件独立性。在数据集中,它假设在已知观测值(我们的预测值)的情况下,各个特征两两相互独立
3.1 公式表达
3.2 图表达
说明:在已知Y的情况下,X1~XN与Y的链子就会断裂,从而导致X1~XN相互独立。
3.3 案例解释
现我们有如下字段:
智力():
(低),
(高)
考试成绩():
(及格),
(良好),
(优秀)
高考成绩():
(低),
(高)
观测值:
特征:
当我们不知道一个人的智力()时,我们可以通过判断这个人的考试成绩(
)来推断这个人的高考成绩(
)会如何。但是,当我们知道这个人的智力后,
和
就没有关系了。因为哪怕一个已知高智商的人的考试成绩(
)只取得了及格(
),也不影响我们判断这个人的高考成绩会取得高(
)。这表明已知I,G对S没有影响,即相互独立。
4. 求解方法
4.1 X和Y离散
老老实实MAP穷举
如:
P(X)之所以不考虑是因为它不影响我们取到最大值。
4.2 X和Y连续可导
若不熟悉以下方法,可以参考笔者的其它文章 → 最大似然估计与贝叶斯公式 梯度下降和牛顿法
4.2.1 最大似然估计
后验分布对
求导,求出令导数为0的
即可
4.2.2 梯度下降或牛顿法
通过泰勒公式的一阶和二阶展开形式,持续迭代x,得到后验分布的局部最优解。