统计学习基本三要素----基础知识

本文探讨统计学习的三个核心要素:模型(包括决策函数和参数空间)、策略(如损失函数和风险函数)和算法(如正则化与交叉验证)。介绍了正则化在防止过拟合中的作用,以及交叉验证的不同类型。还讨论了泛化能力、生成模型与判别模型的对比,以及在分类问题和回归问题中常用的方法和评估指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

统计学习三要素

方法=模型+策略+算法

模型:
1.决策函数的集合
2.参数空间
3.条件概率的集合
4.参数空间

策略:
损失函数
风险函数
O-1损失函数
平方损失函数
绝对损失函数
对数损失函数
损失函数的期望
经验风险

提醒:
经验风险最小化与结构风险最小化
当样本容量很小时,会有过拟合。
结构风险最小化,防止过拟合提出的策略。等价于正则化。
最优模型就是求解最优化问题。

算法:如果最优化问题有显式的解析式,算法比较简单。但通常解析式不存在,就需要数值计算的方法。

正则化与交叉验证

交叉验证:训练集 用于训练模型
验证集 用于模型选择
测试集 同于最终对学习方法的评估

1.简单交叉验证
2.S折交叉验证
3.留一交叉验证

泛化能力

泛化误差性质:样本容量增加,泛化误差趋于0

生成模型与判别模型
生成模型:

条件概率
朴素贝叶斯法和隐马尔可夫模型

常见:

1. 判别式分析
2. 朴素贝叶斯Native Bayes
4. K近邻KNN
5. 隐马尔科夫模型HMM
6. 贝叶斯网络
7. sigmoid belief networks
8. 马尔科夫随机场Markov random fields
9. 深度信念网络DBN
10. 隐含狄利克雷分布简称LDA(Latent Dirichlet allocation)
11. 多专家模型(the mixture of experts model)

判别方法由数据直接学习决策函数f(X)或田间概率分布 P(Y|X)作为预测的模型,即判别模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值