朴素贝叶斯相关概念

最新推荐文章于 2025-03-12 22:34:27 发布

天涯__

最新推荐文章于 2025-03-12 22:34:27 发布

阅读量818

点赞数

分类专栏：统计学习方法笔记文章标签：机器学习朴素贝叶斯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wy250229163/article/details/52578039

版权

本文介绍了朴素贝叶斯分类器的工作原理，包括其对特征独立的假设，以及在实际应用中如何处理相关性问题。讨论了在不同特征相关性条件下选择朴素贝叶斯的适用性，并详细阐述了贝叶斯定理和模型建立过程，特别是拉普拉斯平滑在处理零概率问题中的应用。此外，文章还提供了一个垃圾账号分类的实例来进一步说明朴素贝叶斯的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

朴素贝叶斯

朴素贝叶斯是贝叶斯分类器里的一种方法。之所以称它朴素，原因就在于做出了特征条件全部独立的假设，但实际上，特征相互之间很大程度上都不是独立的，都有一些内在联系。但是，实践证明这因素也并未产生多大影响。
基于以上，可以总结，
1. 当样本特征数量比较多，且相关性比较大时，不适宜用朴素贝叶斯分类器，可以采用更好的如决策树等。
2. 当样本特征相关性不是那么强时，便可采用。

数学模型

首先来回忆一下贝叶斯定理：

- P(A)、P(B) 分别是事件A、B发生的先验概率。之所以称为‘先验’，是因为这个概率是我们根据经验和分析而得出的，比如根据伯努利大数定律，我们用事件发生的频率来计算发生的概率。
- P(A|B)、P(B|A)分别是在事件B/A发生的条件下，事件A/B发生的概率，也就是所说的后验概率。

接着建立朴素贝叶斯模型：

输入空间 X∈Rn ，输出空间是类别标记集合 Y={C1，C2，C3…Ck}
P(X,Y)是X和Y的联合概率分布。训练数据T={(x1,y1),(x2,y2,)(x3,y3)…,(xn,yn)} 是由P(X,Y)独立同分布产生。要注意的是，这里的xi实际上是一个多维向量，yi代表的是分类的标签。
P(X,Y)实际上就通过训练数据集学习出来的。P(X,Y)=P(Y=Ck)*

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。