机器学习系列-朴素贝叶斯分类器

最新推荐文章于 2024-05-14 10:25:58 发布

原创

最新推荐文章于 2024-05-14 10:25:58 发布 · 484 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了贝叶斯分类器的基础，特别是朴素贝叶斯分类器。通过贝叶斯定理，解释了如何利用条件概率进行分类。文章详细讨论了如何在特征属性为连续值时估计条件概率，并介绍了Laplace校准来解决特征项划分频率为0的问题。最后，概述了朴素贝叶斯算法的优点和缺点，强调了其在实际应用中的价值。

贝叶斯分类器

什么是贝叶斯分类器

贝叶斯分类器是一类分类器的总称，这些分类器均以贝叶斯定理为基础，故统称为贝叶斯分类器。这些分类器中最简单的是朴素贝叶斯分类器，它几乎完全按照贝叶斯定理进行分类，因此我们从朴素贝叶斯分类器说起。

贝叶斯定理：

贝叶斯定理是概率论中一个比较重要的定理，在讲解贝叶斯定理之前，首先回顾一下贝叶斯定理的基础：条件概率和全概率公式。

条件概率：设 $A,B$ 是两个事件，且 $P(A)>0$ ，称
$P (B | A) = P ( A B ) P ( A )$ $P(B|A)=\frac{P(AB)}{P(A)}$
为在事件 $A$ 发生的情况下事件 $B$ 发生的条件概率。

条件概率很容易理解。一般情况下，概率可以表示为事件所包含的基本事件数（表示为 $count(B)$ ）与样本空间的基本事件数（表示为 $count(S)$ ）之商，即

P (A) = c o u n t ( B ) c o u n t ( S )

$P(A)=\frac{count(B)}{count(S)}$
当我们在求条件概率时，分母不再是

count(S) $count(S)$ 而是

count(A∩S) $count(A\cap S)$ ，而分子也变成了

count(A∩B) $count(A\cap B)$ ，因此

P (B | A) = c o u n t ( A B ) c o u n t ( A S ) = c o u n t ( A B ) c o u n t ( A )

$P(B|A)=\frac{count(AB)}{count(AS)}=\frac{count(AB)}{count(A)}$
因为

count(AB)count(A)=P(AB)count(A)P(A)count(A) $\frac{count(AB)}{count(A)}=\frac{P(AB)count(A)}{P(A)count(A)}$ ，约去

count(A) $count(A)$ ，就得到了条件概率公式。

全概率公式：设试验 $E$ 的样本空间为 $S$ ， $A$ 为

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。