机器学习算法与相关工具入门
一、机器学习模型概述
1. 生成模型与判别模型
生成模型尝试拟合两个事件(或随机变量)X 和 Y 的联合概率分布 p(X, Y),其中 X 和 Y 分别代表两组观测变量 x 和隐藏(潜在)变量 y。判别模型则学习在给定观测变量 X 的情况下,隐藏变量 Y 的条件概率 p(Y|X)。
生成模型通常通过贝叶斯规则引入。给定事件 X 时事件 Y 的条件概率,可计算为给定事件 Y 时事件 X 的条件概率与事件 X 的概率之积,再除以事件 Y 的概率。
判别模型与生成模型相反,它直接计算条件概率 p(Y|X),并且在训练和分类时使用相同的算法。
以下是生成模型和判别模型在不同方面的对比:
| 目标 | 生成模型 | 判别模型 |
| ---- | ---- | ---- |
| 准确性 | 高度依赖训练集 | 概率估计往往更准确 |
| 建模要求 | 需要对观测变量和隐藏变量进行建模,需要大量训练 | 训练集质量要求不如生成模型严格 |
| 计算成本 | 通常较低,例如基于贝叶斯规则的图形方法开销小 | 大多数算法依赖凸优化,会引入显著的性能开销 |
| 约束条件 | 假设模型特征之间存在一定程度的独立性 | 大多数判别算法能适应特征之间的依赖关系 |
2. 强化学习
强化学习在机器人或游戏策略领域之外,不如监督学习和无监督学习那么广为人知。自 90 年代以来,基于遗传算法的分类器在解决需要与领域专家协作的问题时越来越受欢迎。对于某些类型的应用,强化学习算法会输出一组推荐动作,供自适应系统执行。最简单的形式是,这些算
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



