《统计学习方法》学习笔记1——概论

本文深入探讨了统计学习的基本概念,包括数据、模型、策略和算法。覆盖监督、非监督、半监督及强化学习,解析了损失函数、风险最小化等关键策略,以及过拟合的解决方法如正则化和交叉验证。最后,对比了生成模型与判别模型的不同之处。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

统计学习

统计学习的对象是数据。
统计学习的方法:监督学习、非监督学习、半监督学习、强化学习。
统计学习方法三要素:模型、策略、算法。

监督学习

输入空间与输出空间:输入与输出可能的取值的集合。
具体输入通常由特征向量表示。
特征向量存在的空间为特征空间。
模型定义在特征空间上。
监督学习的目的是学习一个由输入到输出的映射,由模型表示。
模型属于从输入空间到输出空间的映射的集合。
监督学习的模型:概率模型、非概率模型。

学习策略

损失函数
经验风险最小化
结构风险最小化(加上正则化项(罚项))

模型评估

训练误差
测试误差
过拟合:正则化、交叉验证(简单交叉验证、S折交叉验证、留一交叉验证)

泛化能力

生成模型与判别模型

生成方法:由数据联合概率分布求出条件概率分布
判别方法:数据直接学习决策函数或条件概率分布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值