轻松搞定朴素贝叶斯(有例题)

朴素贝叶斯算法：用苹果质量分类来理解

最新推荐文章于 2025-05-05 21:32:15 发布

原创最新推荐文章于 2025-05-05 21:32:15 发布 · 7.4k 阅读

·

14

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #机器学习 #概率论

首先我们应该先弄清楚朴素贝叶斯是用来干什么的：

我们收集了大量不同质量苹果的大小、颜色、形状这三个苹果的特征信息后，如果这时又来了一个新的苹果，朴素贝叶斯就可以通过这个苹果的大小、颜色、形状判断这个苹果的质量

接下来我们会讲解公式，但是在讲解公式之前，为了大家便于理解，我们先说一下各个变量是什么：

Y就是苹果的质量

X就是苹果的大小、颜色、形状这三个特征组成的向量；x1就代表苹果的大小，x2代表苹果的颜色，x3代表苹果的形状

朴素贝叶斯可以让我们通过一个苹果的特征向量，判断这个苹果的质量是怎么样的,即在已知苹果的大小、颜色、形状是怎么样的情况下求出这个苹果的质量，也就是P(Y|X)

下面我们结合实例理解朴素贝叶斯公式：

我们收集了10个不同质量苹果的特征信息：

：

朴素贝叶斯公式：

给定一个X（即已知这个苹果的大小、颜色、形状），我们就可以分别求出在这个X的前提下，这个苹果的质量是优或者差的概率，即P(Y=优|X)、P(Y=差|X)，这两个概率哪个大，那么这个苹果的质量就是哪个。

结合公式进行一个具体的计算：

例：现在有一个大的、红色的、不规则的苹果，请问他是优的苹果还是差的苹果呢？

根据题意

X=大的、红色的、不规则的，即x1=大，x2=红色、x3=不规则

Y=优、差

我们要分别计算在x1=大，x2=红色、x3=不规则的情况下，Y=优、Y=差的概率

先看分子：

P(Y=优)为这10个苹果中苹果为优的概率，看题目给出的表，很明显苹果为优的概率是4/10

P(x1=大|Y=优)为在苹果为优的前提下，苹果的大小是大的概率，根据题给的表，这个概率为3/4

P(x2=红|Y=优)为在苹果为优的前提下，苹果的颜色是红色的概率，根据题给的表，这个概率为4/4

P(x3=不规则|Y=优)为在苹果为优的前提下，苹果的形状是不规则的概率，根据题给的表，这个概率为1/4

再来看分母：

由于朴素贝叶斯假设特征向量X中的各个特征x是独立的，所以有下式：

P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)

P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小)，根据题给的表，苹果为大的概率是6/10

P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色)，根据题给的表，苹果为红色的概率是5/10

P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状)，根据题给的表，苹果为不规则的概率是5/10

所以，P(Y=优|x1=大,x2=红,x3=不规则)=(4/10 * 3/4 * 4/4* 1/4) ÷ (6/10 * 5/10 * 5/10) = 1/2

同理，我们可以求P(Y=差|x1=大,x2=红,x3=不规则)

先看分子：

P(Y=差)为这10个苹果中苹果为差的概率，看题目给出的表，很明显苹果为优的概率是6/10

P(x1=大|Y=差)为在苹果为差的前提下，苹果的大小是大的概率，根据题给的表，这个概率为3/6

P(x2=红|Y=差)为在苹果为差的前提下，苹果的颜色是红色的概率，根据题给的表，这个概率为1/6

P(x3=不规则|Y=差)为在苹果为差的前提下，苹果的形状是不规则的概率，根据题给的表，这个概率为4/6

再来看分母（其实和Y=优的情况下是一样的）：

由于朴素贝叶斯假设特征向量X中的各个特征x是独立的，所以有下式：

P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)

P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小)，根据题给的表，苹果为大的概率是6/10

P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色)，根据题给的表，苹果为红色的概率是5/10

P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状)，根据题给的表，苹果为不规则的概率是5/10

所以，P(Y=差|x1=大,x2=红,x3=不规则)=(6/10 * 3/6 * 1/6* 4/6) ÷ (6/10 * 5/10 * 5/10) = 1/18

综上所述，在x1=大，x2=红，x3=不规则的前提下，Y=优的概率是1/2，Y=差的概率是1/18

即

P(Y=优|x1=大,x2=红,x3=不规则)=1/2

P(Y=差|x1=大,x2=红,x3=不规则)=1/18

而1/2大于1/18，即一个大的、红色的、不规则的苹果是优的概率大于是差的概率

所以，如果现在有一个大的、红色的、不规则的苹果，我们可以通过朴素贝叶斯判断这个苹果的质量应该是优

朴素贝叶斯的进阶理解

相信看了上面东西之后你已经完全理解朴素贝叶斯了，但上面的例子中，特征向量X只有三个特征大小(x1)、颜色(x2)、形状(x3)，结果Y也只有优(y1)和差(y2)两个可能

接下来，我们假设特征向量X有m维，即X=(x1,x2,......,xm-1,xm)

结果Y有n维，即Y=(y1,y2,.........,yn-1,yn)

P(Y=y1|X)， P(Y=y2|X)，.........，P(Y=yn|X)就是在给定X的情况下，Y=各个类的概率

给定X的意思就像上面例子中给定一个苹果，他的大小、颜色、形状都是给定的，分别为大、红、不规则

Y=各个类的概率就是在给定苹果的大小、颜色、形状的条件下，苹果的质量为优、差的概率

上图公式推导中的“？”代表这个特征的取值，还是拿苹果例子说明，如果X=(大、红、不规则),那么x1的？就是大，x2的？就是红，x3的？就是不规则。

苹果的特征向量只有三维，他没有x4，x5,x6........，他只有x1-x3，但是如果输入的是一副图像的HOG特征向量，他可能就会有x4,x5,x6......

以上就是朴素贝叶斯理论的讲解了，代码(python)后续会出，有问题可以在评论区指出，谢谢大家。

5 条评论

xzx选择性 2024.01.14
好文 [face]emoji:003.png[/face]

+6- 2023.06.28
第二个属性组合条件下为查果的概率是不是算错了，2/9
- 2301_76536081回复+6- 2024.05.26
  算错了

日出东方落于西 2023.06.10
写的泰裤辣！！！！！！！！！！！！！

优快云-Ada助手 2023.04.24
恭喜您成功完成了第一篇博客！标题十分吸引人，内容也十分实用。希望您能继续写出更多优质的博客，与大家分享您的知识和经验。同时，也希望您能保持谦虚态度，不断进步，成为更好的自己。推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

我有条纹汪汪汪

博客等级

码龄4年

1
原创

14
点赞

56
收藏

2
粉丝

关注

私信

热门文章

轻松搞定朴素贝叶斯(有例题) 7408

最新评论

轻松搞定朴素贝叶斯(有例题)
2301_76536081: 算错了

最新文章

目录

展开全部

收起

评论 5

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。