统计机器学习导论

最新推荐文章于 2024-04-13 11:24:19 发布

风已无痕

最新推荐文章于 2024-04-13 11:24:19 发布

阅读量427

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/wqs12345612/article/details/116053694

版权

机器学习专栏收录该内容

2 篇文章

订阅专栏

本文概述了统计学习的核心概念，包括监督学习的步骤、数学定义、模型评估与选择、正则化和交叉验证。重点讨论了泛化能力，解释了泛化误差上界的原理，并对比了生成模型与判别模型的特点。同时，阐述了分类、标注和回归这三大问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.知识树

在这里插入图片描述

2.监督学习

在这里插入图片描述

2.1.监督学习的实现步骤

得到一个有限的训练数据集合
确定模型的假设空间，也就是所有的备选模型
确定模型选择的准则，即学习的策略
实现求解最优模型的算法
通过学习方法选择最优模型
利用学习的最优模型对新数据进行预测

2.2.监督学习数学定义

训练集:
$T = \{(x_1,y_1),(x_2,y_2),...,(x_ N,y_N)\}$
实例 $x$ 的特征向量:
$x={(x^{(1)},x^{(2)},...,x^{(n)})}^T$
模型:
种类一：
1)决策函数 $Y = f (X)$
预测形式 $y = f (x)$
种类二：
2)条件概率分布 $P (Y ∣ X)$
预测形式 $arg\max_y{P(y|x)}$

3.统计学习要素

3.1.要素1：模型（假设空间）

决策函数：
$\{f|Y = {f_\theta(X)},\theta\in\R^n\}$
条件概率分布：
$\{P|{P_\theta(Y|X)},\theta\in\R^n\}$

3.2.要素2：策略**

0-1损失函数：
$\left\{ \begin{matrix} 1,Y\neq{f(X)}\\ 0,Y={f(X)} \end{matrix} \right.$
平方损失函数：
$L(Y,f(X)) = {(Y-f(X))}^2$
绝对损失函数：
$L (Y, f (X)) = ∣ Y - f (X) ∣$
对数损失函数：
$L (Y, P (Y ∣ X)) = - l o g P (Y ∣ X)$
经验风险最小化：
$\min_{f\in{F}}{\frac{1}{N}{\sum_{i=1}^{n}{L(y_i,f(x_i))}}}$
结构风险最小化：
$\min_{f\in{F}}{\frac{1}{N}{\sum_{i=1}^{n}{L(y_i,f(x_i))}+\lambda{J(f)}}}$

3.3.算法

4.模型评估与选择

4.1.训练误差

${\frac{1}{N}{\sum_{i=1}^{N}{L(y_i,\hat{f}(x_i))}}}$

4.2.测试误差

${\frac{1}{N^{'}}{\sum_{i=1}^{N^{'}}{L(y_i,\hat{f}(x_i))}}}$

5.正则化与交叉验证

在这里插入图片描述

5.1.正则化

最小化结构风险
$\min_{f\in{F}}{\frac{1}{N}{\sum_{i=1}^{n}{L(y_i,f(x_i))}+\lambda{J(f)}}}$

5.2.交叉验证

数据集随机划分为以下3部分：
训练集：模型的训练
验证集：模型的选择
测试集：模型的评估

6.泛化能力

泛化误差上界
对于二分类问题，当假设空间是有限个函数的集合 $F=\{f_1,f_2,...,f_d\}$ 时，对任意一个函数 $f\in{F}$ ,至少以概率 $1-\sigma$ ,以下不等式成立：
$R(f)\le{\hat{R}(f)+\xi(d,N,\sigma)}$
其中，
$\xi(d,N,\sigma) = \sqrt{\frac{1}{2N}(logd+log{\frac{1}{\sigma}})}$

7.生成模型与判别模型

生成方法
$P(Y|X)=\frac{P(X,Y)}{P(X)}$
判别方法
$f (X) 或 P (Y ∣ X)$
举例：如何知道女孩子的姓名？
生成方法：我要是把她爸妈建模出来，直接问她爸妈不行么？
判别方法：她叫小红的概率是多少？她叫小刘的概率是多少？

8.统计学习三大问题

8.1.分类问题

TP：将正类预测为正类数；
FN：将正类预测为负类数；
FP：将负类预测为正类数；
TN：将负类预测为负类数。
精准率：预测为正类的样本中有多少被分对了
$\frac{TP}{TP+FP}$
召回率：在实际的正类中，有多少正类被模型发现了
$\frac{TP}{TP+FN}$
F1值
$\frac{2}{F_1}=\frac{1}{P}+\frac{1}{R}$
$F_1=\frac{2TP}{2TP+FP+FN}$