首先我们应该先弄清楚朴素贝叶斯是用来干什么的:
我们收集了大量不同质量苹果的大小、颜色、形状这三个苹果的特征信息后,如果这时又来了一个新的苹果,朴素贝叶斯就可以通过这个苹果的大小、颜色、形状判断这个苹果的质量
接下来我们会讲解公式,但是在讲解公式之前,为了大家便于理解,我们先说一下各个变量是什么:
Y就是苹果的质量
X就是苹果的大小、颜色、形状这三个特征组成的向量;x1就代表苹果的大小,x2代表苹果的颜色,x3代表苹果的形状
朴素贝叶斯可以让我们通过一个苹果的特征向量,判断这个苹果的质量是怎么样的,即在已知苹果的大小、颜色、形状是怎么样的情况下求出这个苹果的质量,也就是P(Y|X)
下面我们结合实例理解朴素贝叶斯公式:
我们收集了10个不同质量苹果的特征信息:
:
朴素贝叶斯公式:

给定一个X(即已知这个苹果的大小、颜色、形状),我们就可以分别求出在这个X的前提下,这个苹果的质量是优或者差的概率,即P(Y=优|X)、P(Y=差|X),这两个概率哪个大,那么这个苹果的质量就是哪个。
结合公式进行一个具体的计算:
例:现在有一个大的、红色的、不规则的苹果,请问他是优的苹果还是差的苹果呢?

根据题意
X=大的、红色的、不规则的,即x1=大,x2=红色、x3=不规则
Y=优、差
我们要分别计算在x1=大,x2=红色、x3=不规则的情况下,Y=优、Y=差的概率

先看分子:
P(Y=优)为这10个苹果中苹果为优的概率,看题目给出的表,很明显苹果为优的概率是4/10
P(x1=大|Y=优)为在苹果为优的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/4
P(x2=红|Y=优)为在苹果为优的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为4/4
P(x3=不规则|Y=优)为在苹果为优的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为1/4
再来看分母:
由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式:
P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)
P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10
P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10
P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10
所以,P(Y=优|x1=大,x2=红,x3=不规则)=(4/10 * 3/4 * 4/4* 1/4) ÷ (6/10 * 5/10 * 5/10) = 1/2
同理,我们可以求P(Y=差|x1=大,x2=红,x3=不规则)

先看分子:
P(Y=差)为这10个苹果中苹果为差的概率,看题目给出的表,很明显苹果为优的概率是6/10
P(x1=大|Y=差)为在苹果为差的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/6
P(x2=红|Y=差)为在苹果为差的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为1/6
P(x3=不规则|Y=差)为在苹果为差的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为4/6
再来看分母(其实和Y=优的情况下是一样的):
由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式:
P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)
P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10
P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10
P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10
所以,P(Y=差|x1=大,x2=红,x3=不规则)=(6/10 * 3/6 * 1/6* 4/6) ÷ (6/10 * 5/10 * 5/10) = 1/18
综上所述,在x1=大,x2=红,x3=不规则的前提下,Y=优的概率是1/2,Y=差的概率是1/18
即
P(Y=优|x1=大,x2=红,x3=不规则)=1/2
P(Y=差|x1=大,x2=红,x3=不规则)=1/18
而1/2大于1/18,即一个大的、红色的、不规则的苹果是优的概率大于是差的概率
所以,如果现在有一个大的、红色的、不规则的苹果,我们可以通过朴素贝叶斯判断这个苹果的质量应该是优
朴素贝叶斯的进阶理解
相信看了上面东西之后你已经完全理解朴素贝叶斯了,但上面的例子中,特征向量X只有三个特征大小(x1)、颜色(x2)、形状(x3),结果Y也只有优(y1)和差(y2)两个可能
接下来,我们假设特征向量X有m维,即X=(x1,x2,......,xm-1,xm)
结果Y有n维,即Y=(y1,y2,.........,yn-1,yn)

P(Y=y1|X), P(Y=y2|X),.........,P(Y=yn|X)就是在给定X的情况下,Y=各个类的概率
给定X的意思就像上面例子中给定一个苹果,他的大小、颜色、形状都是给定的,分别为大、红、不规则
Y=各个类的概率就是在给定苹果的大小、颜色、形状的条件下,苹果的质量为优、差的概率
上图公式推导中的“?”代表这个特征的取值,还是拿苹果例子说明,如果X=(大、红、不规则),那么x1的?就是大,x2的?就是红,x3的?就是不规则。
苹果的特征向量只有三维,他没有x4,x5,x6........,他只有x1-x3,但是如果输入的是一副图像的HOG特征向量,他可能就会有x4,x5,x6......
以上就是朴素贝叶斯理论的讲解了,代码(python)后续会出,有问题可以在评论区指出,谢谢大家。
朴素贝叶斯算法:用苹果质量分类来理解
4万+





