深度之眼李航《统计学习方法》训练营第六期+第一章统计学习方法概述

本文概览了《统计学习方法》一书的第一章内容,详细介绍了统计学习的基本概念,包括监督学习的实现步骤、统计学习三要素、模型评估与选择等。文章还探讨了正则化、交叉验证、泛化能力等关键主题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《统计学习方法》第一章:统计学习方法概述

       训练营刚刚开始,希望自己能够坚持完成课程内容,啃完这本书,并且坚持做完笔迹,保证博客更新。
       这部分都比较基础,有机器学习基础的都会知道这些概念,这里仅做一个简单小记。主要的内容包含在下图中,可以说贯穿整本书的内容。

在这里插入图片描述

1.1统计学习

监督学习的实现步骤:

  1. 得到一个有限的训练数据集合;
  2. 确定包含所有可能的模型的假设空间, 即学习模型的集合;
  3. 确定模型选择的准则,即学习的策略;
  4. 实现求解最优模型的算法, 即学习的算法;
  5. 通过学习方法选择最优模型;
  6. 利用学习的最优模型对新数据进行预测或分析

1.2监督学习

基本概念:

  1. 输入空间、 特征空间与输出空间
    训练集、测试集、验证集
  2. 联合概率分布
  3. 假设空间
    即备选模型,通过决策函数条件概率分布来预测选择模型

1.3统计学习三要素

  1. 模型
    下图中f以及P就是备选的模型,求解模型就是求解参数θ
    在这里插入图片描述
  2. 策略
    策略主要就是按照什么样的准则学习或选择最优的模型。
    策略主要体现在损失函数上,用来来度量预测错误的程度;损失函数主要有以下几种:
    在这里插入图片描述
    而最终选择模型的策略是经验风险最小化与结构风险最小化:
    在这里插入图片描述

1.4模型评估与模型选择

  1. 训练误差与测试误差
    在这里插入图片描述
  2. 过拟合问题

在这里插入图片描述

1.5正则化与交叉验证

在这里插入图片描述

1.6泛化能力

在这里插入图片描述

1.7生成模型与判别模型

在这里插入图片描述

1.8分类问题

牢记这些评价指标
在这里插入图片描述

1.9标注问题

标注(tagging) 也是一个监督学习问题。 可以认为标注问题是分类问题的一个推广, 标注问题又是更复杂的结构预测(structure prediction)问题的简单形式。
在这里插入图片描述

1.10回归问题

        回归问题得到的是连续的值。这样的话监督学习就可以分为分类问题和回归问题

重点部分

泛化误差上界

在这里插入图片描述

作业

在这里插入图片描述

在网上找到了很好的解答,自己写了一遍,不过还是用截图,自己写得太丑了

在这里插入图片描述
在这里插入图片描述

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值