【周志华 机器学习】入门(下)

目录

六、贝叶斯决策论

6.1 贝叶斯决策论的基础

6.1.1 贝叶斯定理

6.1.2 贝叶斯决策论的定义

6.2 判别式模型和生成式模型

6.3 频率主义和贝叶斯主义

6.3.1 定义比较

6.3.2 模型构建比较

6.4 极大似然估计(MLE)

6.5 朴素贝叶斯分类器(Naive Bayes Classifier)

七、集成学习

7.1核心思想

7.2 主要类型和方法

7.2.1 Bagging(Bootstrap Aggregating)

7.2.2 Boosting

八 、聚类(Clustering)

8.1 定义

8.2 常见聚类算法

8.2.1 K-means聚类

8.2.1.1 算法实现流程

8.2.1.2 优缺点分析

8.2.2 DBSCAN算法

8.2.2.1 算法核心参数

8.2.2.2 算法实现流程

8.2.2.3优缺点分析


六、贝叶斯决策论

6.1 贝叶斯决策论的基础

6.1.1 贝叶斯定理

贝叶斯定理是概率论中的一个基本定理,用来计算在已知一些相关数据的情况下,某事件的概率。

数学表达式为:P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}

其中

  • P(A|B)指在事件B发生的前提下事件A发生的条件概率,称为后验概率
  • P(B|A)指在事件A发生的前提下事件B发生的条件概率,称为似然度
  • P(A)和P(B)分别指事件A和事件B的先验概率

6.1.2 贝叶斯决策论的定义

贝叶斯决策论的核心思想是基于后验概率来选择使得期望损失最小的决策

实现过程:

1.定义决策空间:确定决策集合\mathcal{D}

2.建立先验概率:对决策问题进行建模,定义每个可能的状态或类别 \theta 的先验概率分布 P(\theta)

3.估计条件概率: 估计在每个可能的状态 \theta下观察到数据 x 的条件概率分布 P(x|\theta)

4.计算后验概率:利用贝叶斯定理,计算在观察到数据 x 后每个可能状态 \theta 的后验概率分布 P(\theta|x) 

5.选择最优决策:根据后验概率分布和损失函数 L(d, \theta),选择能够最小化期望损失的最优决策 d^*d^*的数学表达书为:d^* = \arg \min_{d \in \mathcal{D}} \sum_{\theta} L(d, \theta) P(\theta|x)

其中L(d,\theta) 是决策 d 在真实状态 \theta 下的损失

6.2 判别式模型和生成式模型

判别式模型:关注的是通过学习输入数据与输出标签之间的映射关系来进行预测,直接学习类别之间的决策边界或者决策函数。

代表:

  • 决策树
  • BP神经网络
  • SVM

生成式模型:关注的是学习数据的联合概率分布,能够推断出样本的特征,并生成新的样本

代表:

  • 贝叶斯分类器

6.3 频率主义和贝叶斯主义

6.3.1 定义比较

频率主义:频率主义将模型的参数视为固定且真实存在的,通过多次实验来逼近这个固定值

贝叶斯主义:贝叶斯主义将所有的参数都被视为随机变量,每个值都有可能是真实模型使用的值,只是概率不同而已。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

A林玖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值