4、机器学习与监督学习入门

机器学习与监督学习入门

1. 数据集划分与交叉验证方法

在机器学习中,通常会将数据集分割为训练集和测试集,然后反复进行训练、测试和模型选择。以下介绍几种常见的交叉验证方法:

1.1 简单交叉验证

简单交叉验证方法包含以下步骤:
1. 数据划分 :随机将给定数据分为两部分,一部分作为训练集,另一部分作为测试集。例如,可将 70%的数据用作训练集,30%的数据用作测试集。
2. 模型训练 :在各种条件下(如不同的参数数量)使用训练集训练模型,从而得到不同的模型。
3. 模型选择 :在测试集上评估每个模型的测试误差,并选择测试误差最小的模型。

1.2 S 折交叉验证

最常用的方法是 S 折交叉验证,具体步骤如下:
1. 数据分割 :首先,将给定数据随机划分为 S 个大小相同且不相交的子集。
2. 训练与测试 :使用 S - 1 个子集的数据训练模型,并用剩余的子集测试模型。
3. 重复操作 :对 S 种可能的选择重复此过程。
4. 模型选择 :最终,选择在 S 次评估中平均测试误差最小的模型。

1.3 留一法交叉验证

S 折交叉验证的一种特殊情况是 S = N,称为留一法交叉验证,常用于数据不足的情况。这里的 N 指的是给定数据集的容量。

下面用

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值