朴素贝叶斯分类

最新推荐文章于 2022-10-29 18:23:00 发布

SuPhoebe

最新推荐文章于 2022-10-29 18:23:00 发布

阅读量1.6k

点赞数 3

分类专栏：机器学习 & 深度学习机器学习与数学模型文章标签：朴素贝叶斯分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u013007900/article/details/78049587

版权

背景

我们先举一个例子，关于向天上抛硬币的实验，有一个训练集 $\{h,t,x,t,t,t,t\}$ 。那么我们通过这个训练集预测下一个抛的结果就应该是t，因为 $P(t) = {5\over 7}$ 是最大的。
我们再举一个例子，现在有两种假设
1. 老师被外星人绑架了 — $P(1) = 0.00...01$
2. 老师沉迷科研，忘了时间 — $P(2) = 0.99...99$
现在老师上课迟到了，那么是什么原因呢？
1. P(late|1) = 1
2. P(late|2) = 0.15
如果仅仅从概率上来看，必然是因为假设1，因为其概率最大。
明显的，两个例子得出这样的结论是有问题的。因此我们不能仅仅考虑最简单的概率问题。
朴素贝叶斯就是一种正确地使用概率的方法。

朴素贝叶斯（Naive Bayes）是一种简单的分类算法，它的经典应用案例为人所熟知：文本分类（如垃圾邮件过滤）。很多教材都从这些案例出发，本文就不重复这些内容了，而把重点放在理论推导，三种常用模型及其编码实现。

1 理论基础

朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。

这里提到的贝叶斯定理、特征条件独立假设就是朴素贝叶斯的两个重要的理论基础。

1.1 贝叶斯定理

贝叶斯定理便是基于条件概率，通过 $P(A|B)$ 来求 $P(B|A)$ ：

P (B | A) = P ( A | B ) P ( B ) P ( A )

$P(B|A)=\frac{P(A|B)P(B)}{P(A)}$

顺便提一下，上式中的分母 $P(A)$ ，可以根据全概率公式分解为：

P (A) = \sum i = 1 n P (B i) P (A | B i)

$P(A)=\sum_{i=1}^{n}P(B_{i})P(A|B_{i})$

其中 $P(B|A)$ 为posterior， $P(B)$ 为priori， $P(A|B)$ 为likelihood， $P(A)$ 为evidence。

如果像背景中举的两个例子那样只依靠likelihood去进行判断，这种方式叫做Maximum Likelihood(ML)；而朴素贝叶斯则是通过Maximum a-posterior(MAP)。

1.2 特征条件独立假设

这一部分开始朴素贝叶斯的理论推导，从中你会深刻地理解什么是特征条件独立假设。

给定训练数据集 $(X,Y)$ ，其中每个样本x都包括n维特征，即 $x=({x_{1},x_{2},x_{3},...,x_{n}})$ ，类标记集合含有k种类别，即 $y=({y_{1},y_{2},...,y_{k}})$ 。

如果现在来了一个新样本 $x$ ，使用MAP方法。

那么问题就转化为求解 $P(y_{1}|x),P(y_{2}|x),...,P(y_{k}|x)$ 中最大的那个，即求后验概率最大的输出： $argmax_{y_{k}} P(y_{k}|x)$

那

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。