python实践之:用朴素贝叶斯实现分类

本文介绍了朴素贝叶斯理论,包括先验概率和后验概率的概念,以及如何利用这些概念进行预测。接着详细阐述了朴素贝叶斯处理数据的一般流程,特别是对离散和连续特征的处理方式。通过Python代码实现了一个分类任务,测试集准确率为76.38%。最后,提到了朴素贝叶斯假设、概率计算中的问题以及解决策略,并给出了相关案例和学习资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一部分:朴素贝叶斯理论介绍

公式如下:

其中:p(A)、 P(B)称为先验概率,P(A|B)、 P(B|A)称为后验概率、条件概率。

贝叶斯理论描述这样一件事情:当我们知道历史数据,即等式右边,就可以预测未来,等式左边。

虽然预测是有一定概率的,但它仍然给我们预测未来一个可以参考的数据,即概率。


再通俗一点,上述公式表述为:通过历史数据知道A的先验概率,以及B的后验概率时,我们就可以通过贝叶斯理论,估算A的后验概率(在特征B出现的情况下)。

经典的India人糖尿病预测问题就是这样计算出来的。


之所以成为朴素贝叶斯:是因为在讨论各个特征时,假设特征之间是相互独立的,这样贝叶斯计算比较方便。

第二部分:朴素贝叶斯的处理的一般流程为:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值