机器学习之生成式模型与判别式模型的区别

文章讲述了生成式模型关注联合分布建模,能够处理隐变量场景,但可能在准确性上逊色;而判别式模型直接学习条件概率或决策函数,适合小样本学习,且精度通常更高。两者在机器学习中有各自的优势和适用范围。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

根本区别在于是否计算了联合分布P(X,Y)P(X,Y)P(X,Y)和是否比较了模型输出的概率大小.

生成式模型的特点

  • 对联合分布进行建模,然后通过朴素贝叶斯来求条件概率,选择使得条件概率最大的YYY
  • 可以还原出联合概率分布P(X,Y)P(X,Y)P(X,Y)
  • 学习收敛速度快,当样本容量增加时,学到的模型可以更快地收敛于真实模型
  • 应对存在隐变量(不可观测的变量)的场景
  • 相比于判别式模型,往往模型效果差一些
  • 学习到的数据本身信息更多,能反应数据本身特性
  • 学习成本较高,需要更多的计算资源
  • 需要的样本数更多,样本较少时学习效果较差

判别式模型的特点

  • 不能还原出联合概率分布P(X,Y)P(X,Y)P(X,Y)
  • 不能处理存在隐变量的场景
  • 由于直接学习的是条件概率P(X∣Y)P(X|Y)P(XY)或者决策函数f(X)f(X)f(X),往往学习的准确率更高
  • 由于直接学习的是P(X∣Y)P(X|Y)P(XY)或者f(X)f(X)f(X),可以对数据进行各种程序熵的抽象、定义特征并使用特征,可以简化学习问题
  • 对条件概率建模,学习不同类别之间的最优边界
  • 捕捉不同类别特征的差异信息,不学习本身分布信息,无法反映数据本身特性
  • 学习成本较低,需要的计算资源较少
  • 需要的样本数可以较少,少样本也能很好学习

典型的模型

  • 常见的判别式模型有:线性回归、限行判别分析、SVM、神经网络、K近邻、决策树、最大熵模型、boosting、条件随机场
  • 常见的生成式模型: HMM、朴素贝叶斯、GMM、LDA等
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值