朴素贝叶斯法

本文深入探讨了贝叶斯公式的应用,介绍了朴素贝叶斯算法的基本原理,包括先验概率、条件概率和后验概率的概念。通过训练数据集学习先验分布和条件概率分布,简化了高维数据的计算复杂度,最终实现分类器的设计。

1.从贝叶斯公式说起

贝叶斯公式又称逆概率公式,定义为:
在这里插入图片描述
这个公式的目的是求在B已经发生的情况下反推导致这种情况的AjA_jAj出现的概率,求这个概率的前提是P(Ai)P(A_i)P(Ai)P(B∣Ai)P(B|A_i)P(BAi)能直接求出。在这个式子里面P(Ai)P(A_i)P(Ai)被称为先验概率,因为它是事先知道的,P(B∣Ai)P(B|A_i)P(BAi)为条件概率,P(Aj∣B)P(A_j|B)P(AjB)是后验概率,因为是B发生之后求P(Aj)P(A_j)P(Aj)的概率。

2.朴素贝叶斯

先给一组训练数据:
在这里插入图片描述
其中x1x_1x1(x1(1),x1(2),x1(3)⋅⋅⋅x1(m))(x_1^{(1)},x_1^{(2)},x_1^{(3)}···x_1^{(m)})(x1(1),x1(2),x1(3)x1(m)),x2x_2x2(x2(1),x2(2),x2(3)⋅⋅⋅x2(m))(x_2^{(1)},x_2^{(2)},x_2^{(3)}···x_2^{(m)})(x2(1),x2(2),x2(3)x2(m)),···xNx_NxN(xN(1),xN(2),xN(3)⋅⋅⋅xN(m))(x_N^{(1)},x_N^{(2)},x_N^{(3)}···x_N^{(m)})(xN(1),xN(2),xN(3)xN(m)),即公有N个样本,每个样本有mmm个特征,此外样本的输出yyy可以分为kkk个类别,即(c1,c2,⋅⋅⋅cK)(c_1,c_2,···c_K)(c1,c2,cK)

从样本我们可以学到朴素贝叶斯的先验分布,即P(Y=ck)P(Y=c_k)P(Y=ck),学习方法是采用极大似然估计来近似求出P(Y=ck)P(Y=c_k)P(Y=ck),简单来说就是用样本中y=cky=c_ky=ck的概率来近似P(Y=ck)P(Y=c_k)P(Y=ck)

接着学习条件概率分布:
P(X=x∣Y=ck)=P(X1=x1,X2=x2,⋅⋅⋅Xn=xn∣Y=ck)P(X=x|Y=c_k)=P(X_1=x_1,X_2=x_2,···X_n=x_n|Y=c_k)P(X=xY=ck)=P(X1=x1,X2=x2,Xn=xnY=ck)
这是n个维度的条件概率分布,是很难求出的。所以朴素贝叶斯在这里做了一个假设,即XXX的n个维度之间相互独立(朴素贝叶斯和贝叶斯的区别),这样就可以将上式化简为:
P(X=x∣Y=ck)=P(X1=x1∣Y=ck)P(X2=x2∣Y=ck)⋅⋅⋅P(Xn=xn∣Y=ck)P(X=x|Y=c_k)=P(X_1=x_1|Y=c_k)P(X_2=x_2|Y=c_k)···P(X_n=x_n|Y=c_k)P(X=xY=ck)=P(X1=x1Y=ck)P(X2=x2Y=ck)P(Xn=xnY=ck)
这样做大大简化了计算,但会造成准确率下降。计算上面每一项的方法是根据其在样本中出现的概率用极大似然估计来近似。

先验概率和条件概率算完之后就到了后验概率
在这里插入图片描述
这里是整个朴素贝叶斯最重要的地方,我们根据训练数据集来近似求出先验概率和条件概率,然后就可以根据这个式子算出后验概率了。再根据朴素贝叶斯的那个假设来对求解过程进行化简:
在这里插入图片描述
然后进引出了朴素贝叶斯的分类器:
在这里插入图片描述
这个分类器的功能是给其输入一个样本,然后分类器会输出该样本最有可能所属的类别。因为上面式子中分母对所有ckc_kck都是相同的,故使P(Y=ck∣X=x)P(Y=c_k|X=x)P(Y=ckX=x)最大的分类器只需要分子即可:
在这里插入图片描述

3. 算法过程

在这里插入图片描述

4.例子

在这里插入图片描述在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

comli_cn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值