机器学习——先验分布和朴素贝叶斯

本文深入探讨了先验分布、后验分布与似然估计的概念,详细解析了贝叶斯公式的应用,并通过猫的品种分类实例,阐述了朴素贝叶斯分类器的工作原理及其在不同数据类型上的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.先验分布,后验分布与似然估计

先验分布:因,\large P(yin)根据一般经验认为应该满足的分布

后验分布:由果所因,\large P(yin|guo)根据当前数据修正的随机变量的分布

似然估计:由因至果,\large P(guo|yin)

 

二.贝叶斯公式(后验)

大名鼎鼎的公式:\LARGE P_H_o_u_Y_a_n=P_X_i_a_n_Y_a_n*P_S_i_R_a_n/P_G_u_o

全概率公式:

贝叶斯公式:(下面是果的全概率公式,上面是因的先验概率和条件概率


三.朴素贝叶斯做分类问题

PS:之所以说朴素是因为它的特征之间是相互独立的。

当作应用题
已知量

1.一群对象。

有固定种类(A1,A2...An)

每个对象都有固定的特征(B1,B2...Bn)。

 

2.有一个对象O,知道它的特征。

这个对象是哪一个种类。
方法(公式)

朴素贝叶斯公式带入计算,用概率判断。

 

P(种类|特征)P(种类)×P(特征|种类)P(特征)

公式解释(建议自己思考,公式某项不懂再查)

黑体:后验概率(即在这种特征下,是这个种类的概率)

斜体:先验概率(即样本中,该种类的概率)

下划线:影响因子(大则偏向这个种类,小则反之。

绿色:该种类下,是该特征的概率,然后多项乘。紫色:全概率公式计算

 

举个栗子
已知量

1.对象:猫

种类(波斯,暹罗,英短)

特征(体型,毛色,瞳色)

PS:特征,种类等都统计明确。

 

2.有一个猫,给出了体型,毛色,瞳色。

判断它是什么品种
方法

P(波斯|(体型,毛色,瞳色))=P(波斯)×{P(体型,毛色,瞳色|波斯)/P(体型,毛色,瞳色)}

 

P(暹罗|(体型,毛色,瞳色))=P(暹罗)×{P(体型,毛色,瞳色|暹罗)/P(体型,毛色,瞳色)}

 

P(英短|(体型,毛色,瞳色))=P(英短)×{P(体型,毛色,瞳色|英短)/P(体型,毛色,瞳色)}

 

PS:

红色:就是这个项占整体的。

绿色:使用全概率公式计算。

结果那个种类的概率最大,结果就是哪个。

朴素贝叶斯的种类
高斯先验服从高斯分布,适用特征大多数是连续型。
多项式

先验是多项式分布,适用于特征是多元离散。

贝努力先验是贝努力分布,适用特征是二元离散,或者稀疏多元离散。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值