朴素贝叶斯原理

最新推荐文章于 2024-09-03 23:33:58 发布

qianbitou000

最新推荐文章于 2024-09-03 23:33:58 发布

阅读量774

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习模型文章标签：机器学习朴素贝叶斯贝叶斯估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qianbitou000/article/details/88078735

机器学习模型专栏收录该内容

1 篇文章

订阅专栏

最近在看机器学习方面的看法，写写博客增加一下自己的印象。

朴素贝叶斯原理介绍
后验概率最大化的含义
极大似然估计
贝叶斯估计

1、朴素贝叶斯原理介绍

条件独立性假设等于是说用于分类的特征在类确定的条件下都是条件独立的。这一假设使朴素贝叶斯计算起来更加的简单。但有时会牺牲一定的分类准确率。
在介绍贝叶斯之前有几个概念需要弄清楚。

$X$ :训练数据
$Y$ :假设空间
$y_i$ :假设
先验概率 $P(y_i)$ :假设 $y_i$ 的先验概率（Prior Probability）（即在没有训练数据前假设 $y_i$ 拥有的初始概率）
条件概率 $P(X=x_i|y_i)$ ：似然度，在假设 $y_i$ 成立的情况下观察到 $x_i$ 的概率
后验概率 $P(y_i|X)$ ：后验概率，给定训练数据X是 $y_i$ 成立的概率

贝叶斯定理 $P(yi∣X=xi)=P(X=xi∣yi)P(yi)P(X=xi)P(y_i|X=x_i)=\frac{P(X=x_i|y_i)P(y_i)}{P(X=x_i)}$

贝叶斯公式比较重要的一点是，它提供了根据 $P(X=x_i|y_i),P(y_i),P(X)$ 计算后验概率的方法。

朴素贝叶斯分类器：

$y=argmaxckP(Y=ck)∏jP(X(j)=x(j)∣Y=ck)∑kP(Y=ck)∏jP(X(j)=x(j)∣Y=ck)y=\mathop {argmax}_{c_k}\frac{P(Y=c_k)\prod_j{P(X^{(j)}=x^{(j)}|Y=c_k)}}{\sum_kP(Y=c_k)\prod_j{P(X^{(j)}=x^{(j)}|Y=c_k)}}$

(其中因为对于所有的 $c_k$ 分母都相同，为了计算简单上式中省略了分母)

$y=argmaxckP(Y=ck)∏P(X(j)=x(j)∣Y=ck)y=\mathop {argmax}_{c_k}P(Y=c_k)\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}$

2、最大后验概率的意义

在朴素贝叶斯分类算法中，将实例分到后验概率最大的类中。这等价于将期望风险最小化。

3、极大似然估计

在朴素贝叶斯的学习方法中，学习其实就是估计 $P(Y=c_k)$ 和 $P(X^{(j)}=x^{(j)}|Y=c_k)$ 。用极大似然估计法可以估计相应的概率。先验概率 $P(Y=ck)=∑i=1NI(yi=ck)N,k=1,2,...,KP(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)}{N},k=1,2,...,K$
假设朴素贝叶斯一条训练数据的第 $j$ 个特征可能的取值集合为 ${a_{j1},a_{j2},...,a_{js_j}\}$ 则：

$P(X(j)=ajl)∣Y=ck)=∑i=1NI(xi(j)=ajl,yi=ck)∑i=1NI(yi=ck)P(X^{(j)}=a_{jl})|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)}$

$j = 1, 2, . . ., n (x 特征数);$
$l=1,2,...s_j（特征可能取的值数）;$
$k = 1, 2, . . ., K (分类种类数);$

4、贝叶斯估计

上面介绍了极大似然估计，但极大似然估计可能会出现所要估计的概率值为0的情况。这是会影响后验概率的计算结果，使分类产生误差。避免这一情况的做法是采用贝叶斯估计，具体计算公式如下。

$Pλ(X(j)=ajl)∣Y=ck)=∑i=1NI(xi(j)=ajl,yi=ck)+λ∑i=1NI(yi=ck)+sjλP_\lambda(X^{(j)}=a_{jl})|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)+\lambda}{\sum_{i=1}^NI(y_i=c_k)+s_j\lambda}$

$xi(j):x^{(j)}_i:$ 第 $i$ 个实例 $x_i$ 的第 $j$ 个特征。
$a_{jl}:$ 第 $j$ 个特征的第 $l$ 个取值。

其中 $λ≥0\lambda\geq0$ 当 $λ=0\lambda=0$ 就是极大似然估计，当取值为1时就是拉普拉斯平滑（Laplace smoothing）

先验概率的贝叶斯估计：

$Pλ(Y=ck)=∑i=1NI(yi=ck)+λN+KλP_\lambda(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)+\lambda}{N+K\lambda}$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。