李宏毅深度学习笔记(五)分类:概率生成模型(Probabilistic Generative Model)——朴素贝叶斯

本文通过一个具体的案例,详细解析了朴素贝叶斯算法的基本原理。从后验概率的概念出发,介绍了如何利用贝叶斯定理计算样本属于各类别的概率,并探讨了在实际应用中如何构建概率模型。
TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

朴素贝叶斯的引入

假设我们有两个盒子,第一个盒子里有大小形状相同的4颗蓝球,1颗绿球;第二个盒子里有大小形状相同的2颗蓝球,3颗绿球。我们从两个盒子里任取一颗球是蓝球,问这颗蓝球从第一个盒子里面取出的概率是多少?
这就是后验概率的问题,根据贝叶斯定理计算如下:

P(B1∣Blue)=P(Blue∣B1)P(B1)P(Blue∣B1)+P(Blue∣B2)P(B2)P(B_1|Blue)=\frac{P(Blue|B_1)P(B_1)}{P(Blue|B_1)+P(Blue|B_2)P(B_2)}P(B1Blue)=P(BlueB1)+P(BlueB2)P(B2)P(BlueB1)P(B1)

将上述例子一般化之后就如下图所示:
在这里插入图片描述
xxx是蓝色,则P(x∣C1)=45P(x|C_1)=\frac{4}{5}P(xC1)=54, P(C1)=510=12P(C_1)=\frac{5}{10}=\frac{1}{2}P(C1)=105=21,P(x∣C2)=25P(x|C_2)=\frac{2}{5}P(xC2)=52, P(C2)=510=12P(C_2)=\frac{5}{10}=\frac{1}{2}P(C2)=105=21

通过上面的推论我们知道了如何求取一个新给的样本属于各个类别的概率,但上面所讲的是在一个封闭的系统(xxx只能从两个盒子里面抽取)里面的概率,且我们可以直接看出两个类别的概率分布。然而,在实际的应用中我们往往没有某一个类别精确的概率分布,我们的训练集也无法穷举所有的可能性,这时候就要求我们对一个类别求取一个最符合它样本分布的概率模型,以便我们在这个概率模型下计算P(x∣Ci)P(x|C_i)P(xCi)

如何求取概率模型

我们先假设数据的概率分布(正态、伯努利、播送、···),然后用概率公式去计算xxx属于的类型P(C1∣x)P(C_1|x)P(C1x)
一般的,我们假设xxx为高斯分布,这是由概率论中的中心极限定理所得来的。

多维高斯分布:
在这里插入图片描述
其中均值为μ\muμ,协方差为∑\sum
这里举个例子来看一下不同的μ\muμ∑\sum对分布的影响:
在这里插入图片描述在这里插入图片描述

接下来就是求取这个假设的分布中的参数μ\muμ∑\sum了,这里用极大似然估计来求取。比如说我们用某个模型生成了下图所示的79个样本点,那么我们的目的就是要求最有可能生成这79个样本点的模型,即求出这个模型的μ\muμ∑\sum
在这里插入图片描述
这里我们用下面的极大似然估计的函数:
在这里插入图片描述

我们按照上式和两个类别的训练集来求出两个类别的极大似然估计函数的系数(第一个类别中有79个样本,第二个类别中有61个样本):
在这里插入图片描述

分类

接下来就可以将分布函数带入到贝叶斯函数中来进行分类了:
在这里插入图片描述
如果P(C1∣x)>0.5P(C_1|x)>0.5P(C1x)>0.5则可以推出xxx是属于第一类的。
在这里插入图片描述

但通常情况是两个模型会共用一个∑\sum,那么似然函数就变成了:
在这里插入图片描述
这个式子中的μ1\mu_1μ1μ2\mu_2μ2和上面的式子中是一样的,∑=79140∑1+61140∑2\sum=\frac{79}{140}\sum^1+\frac{61}{140}\sum^2=140791+140612

这个时候就变成了线性分类:
在这里插入图片描述
可以看到上面的模型分类准确率并不高,这可能是特征值选取的比较少,在增加特征值之后会好很多。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

comli_cn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值