机器学习 —— 生成模型和判别模型

本文详细介绍了生成模型和判别模型的概念、优缺点及典型应用案例,对比了两种模型在无监督学习和监督学习场景下的适用性,并列举了各自常见的模型类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

生成模型(Generative Model)

作用:判别式模型估计条件概率分布P(y|x),判别数据的输出量。

特性:寻找不同类别之间的最优分类面,反映的是异类数据之间的差异。因此,生成模型更适用于无监督学习

求解思路:联合分布 —> 求解类别先验概率和类别条件概率

优点:

  1. 能学习联合概率分布,
  2. 能够通过联合概率分布和贝叶斯准则计算条件概率分布,
  3. 能够通过联合概率分布计算边缘分布。
  4. 能够学习隐变量
  5. 收敛速度快

缺点:

  1. 需要更大的样本量和计算量
  2. 准确率低
  3. 类别条件概率的许多信息是我们做分类用不到,因而如果我们只需要做分类任务,就浪费了计算资源。

典型的生成模型包括:

  1. 混合高斯模型和其他混合模型
  2. 隐马尔可夫模型(HMM)
  3. 随机上下文无关文法
  4. 朴素贝叶斯分类器(NB)
  5. AODE分类器
  6. 潜在狄利克雷分配模型(LDA)
  7. 有限波尔兹曼机

判别模型(Discriminative Model)

作用:判别式模型估计条件概率分布P(y|x),判别数据的输出量。

特性:对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度。因此,判别模型更适合监督学习。  

求解思路:条件分布 —> 模型参数后验概率的最大值 —> (似然函数 * 参数先验)的最大值 —> 最大似然

优点:

  1. 节省计算资源
  2. 需要的样本数量少。
  3. 直接面对预测,往往学习的准确率更高。
  4. 由于直接学习P(Y|X)或P(X),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

缺点:

  1. 不能学习隐变量
  2. 不能学习联合概率分布
  3. 收敛速度较慢

典型的判别模型包括:

  1. 感知机
  2. 逻辑回归
  3. 支持向量机
  4. k近邻
  5. 决策树
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值