9、机器学习中的监督学习与特征提取

机器学习中的监督学习与特征提取

1. 监督学习概述

在机器学习中,最终目标是开发出不仅在给定训练数据上表现良好,而且对于与训练数据在统计上相似的任何新的未见样本也能有出色表现的优秀模型。在实践中,学习到的模型的性能通常可以基于一个在前期步骤中未使用过的保留数据集进行经验评估。这个保留测试集应与机器学习系统最终运行的实际条件相匹配,并且需要足够大,以提供具有统计显著性的结果。此外,不应重复使用同一个测试集来评估同一学习方法,因为这可能会导致过拟合。

经验评估虽然简单,但由于多种原因可能并不完全令人满意。如果可能的话,最好寻求关于学习方法是否以及为何能收敛到良好解决方案,以及学习到的模型为何能很好地泛化到所有可能的未见数据的强有力的理论保证。对于许多流行的机器学习方法来说,进行严格的理论分析具有挑战性,但这应作为机器学习中的一个关键研究目标得到进一步强调。

1.1 常见监督学习方法案例

以下是一些在过去几十年中被广泛研究的流行机器学习方法:
| 方法名称 | 组成要素 | 特点 | 应用场景 |
| — | — | — | — |
| 线性回归 | (线性模型) × (最小二乘误差) | 采用最简单的模型形式和最易处理的损失度量标准,有简单的闭式解,适用于小数据集,结果易于直观解释 | 金融、经济和其他社会科学领域 |
| 岭回归 | (线性模型) × (最小二乘误差 + 最小 L2 范数) | 在线性回归公式基础上施加简单的 L2 范数最小化,有简单的闭式解,可缓解线性回归中参数过多导致的估计问题,如过拟合 | 处理高维数据时避免过拟合 |
| LASSO | (线性模型) × (最小二乘误差 + 最小 L1

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值