朴素贝叶斯,难?一文让你清楚理解贝叶斯原理

本文深入探讨概率论中的核心概念,包括简单概率计算、条件概率及贝叶斯公式的应用。通过具体案例,如考试前的行为与挂科的关系,阐述如何使用贝叶斯公式进行预测分析。

目录

题外话:

预备知识:

简单计算概率(热身运动):

条件概率 :

 贝叶斯公式

贝叶斯公式应用 


题外话:

充分条件和必要条件

  1. 天下雨→地湿,地湿\nrightarrow天下雨(有可能是自己泼的水造成地湿了),天下雨是充分条件
  2. 阳光充足\nrightarrow花长得好,阳光充足\leftarrow花长得好     阳光充足是必要条件

预备知识:

  1. 概率:P(A)代表A事件发生的概率
  2. 条件概率:P(A|B)=\frac{P(A\cap B)}{P(B)}代表在B事件发生的情况下A事件发生的概率
  3. 贝叶斯公式:P(A|B)=\frac{P(B|A)*P(A)}{P(B)}(下面有推导过程)

以考试前两天是否喝酒(x_{1})、是否逛街(x_{2})、是否学习(x_{3})预测是否挂科(y)为例.其中x_{1}=0,代表没有喝酒,x_{1}​​​​​​=1代表喝酒。x_{2}=0代表没有逛街,x_{2}=1代表逛街。x_{3}=0代表没有学习,x_{3}代表学习了。

 

样本
序号考挂(y)喝酒(x_{1})逛街(x_{2})学习(x_{3}​​​​​​​)
11110
20001
30101
41100
51010
60011
70010
81001

根据上面样本做下面的计算

简单计算概率(热身运动):

 P(y=1)=\frac{4}{8}​​​​​​​,挂科的概率

 P(y=0)=\frac{4}{8}​​​​​​​,不挂科的概率

P(x_{1}=0)=\frac{3}{8},喝酒的概率

P(y=1 \cap x_{1}=1)=\frac{2}{8},喝酒并且挂科的概率

P(y=1 \cap x_{3}=1)=\frac{1}{8},学习并且挂科的概率

是不是身体热起来了~~~~~~~~~~~~~~~

条件概率 :

条件概率的定义不懂得自行百度啊(我是表情符号)

P(y=1|x_{1}=1)=\frac{P(y=1\cap x_{1}=1)}{P(x_{1}=1)}=\frac{2}{3}

P(y=1|x_{2}=1)=\frac{P(y=1\cap x_{2}=1)}{P(x_{2}=1)}=\frac{2}{4}

 贝叶斯公式

根据条件概率公式

P(A|B)=\frac{P(A\cap B)}{P(B)}(1)

P(B|A)=\frac{P(B\cap A)}{P(A)}​​​​​​​(2)

联立(1),(2)可得

P(A|B)=\frac{P(B|A)*P(A)}{P(B)}

贝叶斯公式应用 

贝叶斯公式来用于分类器

假如你有一个样本,x_{1}=0,x_{2}=0,x_{3}=1,我们来预测下是否挂科。请看官往下看~~

又是预备知识:P(x_{1},x_{2},x_{3}|y)=P(x_{1}|y)*P(x_{2}|y)*P(x_{3}|y)

首先计算挂科的概率

P(y=1|x_{1}=0,x_{2}=0,x_{3}=1)=\frac{P(x_{1}=0,x_{2}=0,x_{3}=1|y=1)*P(y=1)}{P(x_{1}=0,x_{2}=0,x_{3}=1)}

=P(x_{1}=0,x_{2}=0,x_{3}=1|y=1)=P(x_{1}=0|y=1)*P(x_{2}=0|y=1)*P(x_{3}=1|y=1)*P(y=1)=\frac{2}{4}*\frac{2}{4}*\frac{1}{4}*\frac{1}{2}=\frac{4}{128}(1)

 然后计算不挂科的概率

 P(y=0|x_{1}=0,x_{2}=0,x_{3}=1)=\frac{P(x_{1}=0,x_{2}=0,x_{3}=1|y=0)*P(y=0)}{P(x_{1}=0,x_{2}=0,x_{3}=1)}

=P(x_{1}=0,x_{2}=0,x_{3}=1|y=0)=P(x_{1}=0|y=0)*P(x_{2}=0|y=0)*P(x_{3}=1|y=0)*P(y=0)=\frac{18}{128}(2)

(1)的概率小于(2),经过计算(1),(2)的概率我们判断不喝酒 ,不逛街,学习x_{1}=0,x_{2}=0,x_{3}=1那么他不会挂科(还是不能浪~~哈)

为了深入理解朴素贝叶斯算法在红酒数据集上的应用及其分类性能评估,建议阅读《朴素贝叶斯算法在wine数据集的分类应用》。该资料详细描述了如何使用朴素贝叶斯算法进行红酒数据集的分类任务,并对模型的分类准确率进行了评估。 参考资源链接:[朴素贝叶斯算法在wine数据集的分类应用](https://wenku.youkuaiyun.com/doc/6412b516be7fbd1778d41e4b?spm=1055.2569.3001.10343) 首先,朴素贝叶斯分类器假设数据特征之间相互独立,这一点在处理红酒数据集时尤为重要。红酒数据集包含了多个化学成分的测量值,这些成分作为特征,用于预测红酒的品质类别。根据朴素贝叶斯的理论基础,模型会首先对每个类别下各个特征的条件概率进行估计。 接下来,为了应用朴素贝叶斯算法,你需要进行以下几个步骤: 1. 数据预处理:红酒数据集通常需要进行数据标准化,以便将不同量纲的特征转换到同一量级。然而,由于朴素贝叶斯的特性,对于红酒数据集,你可能需要评估是否需要进行这一步骤。 2. 条件概率计算:对于红酒数据集的每个特征,你需要计算在特定类别下该特征的条件概率。如果数据特征是连续的,则通常假设特征服从正态分布,并使用正态分布的概率密度函数来计算概率。 3. 分类预测:对于一个待分类的样本,你需要根据已知的概率分布计算该样本属于每个类别的后验概率。朴素贝叶斯算法会计算样本属于每个类别的可能性,并选择可能性最大的类别作为预测结果。 4. 性能评估:模型训练完成后,使用测试集数据对模型进行评估,计算分类准确率。你还需要绘制ROC曲线,并计算其他性能指标,如精确率、召回率F1分数,以全面评估模型性能。 通过以上步骤,你可以有效地将朴素贝叶斯算法应用于红酒数据集,并评估模型的分类准确率。对于想要深入了解数据预处理、特征选择、模型训练评估的读者,《朴素贝叶斯算法在wine数据集的分类应用》一文提供了全面的视角实用的指导。 参考资源链接:[朴素贝叶斯算法在wine数据集的分类应用](https://wenku.youkuaiyun.com/doc/6412b516be7fbd1778d41e4b?spm=1055.2569.3001.10343)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大望dawang

谢谢你请的咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值