生成学习算法

本文深入探讨了生成学习算法的原理,包括高斯判别分析和朴素贝叶斯分类器,对比了它们与logistic回归的区别。高斯判别分析适用于连续特征,通过多变量高斯分布进行建模;朴素贝叶斯分类器则适用于离散特征,通过特征条件独立假设简化计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

生成学习算法:对 p ( x , y ) p(x,y) p(x,y)进行建模,具体是 p ( y ) p(y) p(y) p ( x ∣ y ) p(x|y) p(xy)
预测的时候,利用贝叶斯公式:
在这里插入图片描述

  • 高斯判别分析
    特点: input features x是连续的
    使用多变量高斯分布对 p ( x ∣ y ) p(x|y) p(xy)进行建模
    具体来说:
    在这里插入图片描述

可以看到,两个多变量高斯分布的均值向量不同,但是协方差矩阵是一样的。

然后对数据进行对数极大似然估计:
在这里插入图片描述

得到极大似然参数估计:
在这里插入图片描述

扩展:
高斯判别分析和logistic regression
高斯判别分析可以写成下面的形式,和logistic regression形式一样。
在这里插入图片描述

GDA做了更强的假设, p ( x ∣ y ) p(x|y) p(xy)服从多变量高斯分布,均值向量不同,协方差矩阵相同。而logistic regression没有做任何假设。因此,当高斯分布的假设正确的时候,使用GDA更好,否则使用logistic regression.

  • 朴素贝叶斯分类器
    特点:input features x是离散的
    为何朴素?------做了特征条件独立假设
    在这里插入图片描述

极大似然估计:
在这里插入图片描述
得到:
在这里插入图片描述

上面是二值特征,即每个特征非0即1。

当特征的取值可以取多个的时候, p ( x i ∣ y ) p(x_i|y) p(xiy)是多项式分布。
当特征是连续值的时候,可以将连续特征离散化。

拉普拉斯平滑:
未引入拉普拉斯平滑会出现的问题: p ( x i = a ∣ y ) p(x_i=a|y) p(xi=ay)为0,如果在训练集中 x i = a x_i=a xi=a未出现过。
在这里插入图片描述

扩展:
朴素贝叶斯模型在很多问题上都表现得不错。前面用于文本分类中,每个特征取值为0或1,为1表示出现在文档中,为0表示不出现在文档中。每个特征是伯努利分布。

还可以多项式分布,每次生成一个词的时候,扔骰子决定(骰子的面数是词汇个数)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值