我们先来看一下朴素贝叶斯到底是做了什么,尤其是它的假设哈,我们假定说一个特征他所出现的概率,这个特征就是那个这Ñ个特征哈,然后任何一个特征它出现的概率我们假定它和其它特征是独立的,这个独立指的是条件独立。然后第二个我们认为特征之间是同等重要的,任何一个特征它的重要性一样,它的均衡性是相同的,这是先验性的一个假定哈。我们在这个基础之上来看一下它相关的一些推导。然后我们基于特征之间是独立的这么一个假设,做一个监督的学习算法。它是怎么做的呢,我们假定给出
,然后我们希望做的是给定这些特征的情况之下,我们想去判断一下ý这个类别属于某一个值的概率,而我们可以直接使用贝叶斯定理:
上面这个东西我们做一个假定,就是说:
X1到xn在给定y的时候跟xi和其它特征是条件独立的。因为分母是一定值所以只需要关注分子就可以了。那如果我们能够通过某种办法能够求出来哪一个y它的概率最大,哪一个y就是我们要求的结果。但是现在需要做这么一件事情,到底是什么样的分布呢?那我们就先假定它是高斯分布的,那么:
这么个东西不就可以求得到底哪一个y可以使得取得最大嘛。
在先验条件已知的情况下求后验概率的最大值。