学习贝叶斯分类算法之前,需要先掌握贝叶斯原理。
一些基本概念:
条件概率:在事件A发生的情况下,发生时间事件B的概率,一般用P(B|A)标记。
例如:
有一个红色箱子,一个白色箱子,在红色箱子中有3个黑色石头,4个灰色石头,在白色箱子中有4个黑色石头,有3个白色箱子。那么从红色箱子中去到黑色石头的概率是多少。类似于这样的问题被称为条件概率。
条件概率可以通过以下方式计算出结果
P(A|B) = P(A and B) P(B) 推导出 P(A and B) = P(A|B) / P(B)
B事件发生的情况下,A发生的概率 等价于 A和B同时发生 * P单独发生的概率。
P(B|A) = P(B and A) P(A) 推导出 P(B and A) = P(B|A)/P(A)
根据以上两个推导,又因为P(A and B) = P(B and A)可以得到
P(B|A)/P(A) = P(A|B) / P(B)
P(B|A) =P(A|B) * P(A)/P(B)
把公式P(B|A) =P(A|B) * P(A)/P(B)我们称之为贝叶斯定理。换一种方式描述如下:
P(类别|特征) = P(特征|类别)*P(类别)/P(特征)<