4、机器学习与监督学习入门

最新推荐文章于 2025-12-04 16:26:39 发布

stem5

最新推荐文章于 2025-12-04 16:26:39 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习方法精讲文章标签：机器学习监督学习数据集划分

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/stem5/article/details/151459798

机器学习方法精讲专栏收录该内容

76 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习与监督学习入门

1. 数据集划分与交叉验证方法

在机器学习中，通常会将数据集分割为训练集和测试集，然后反复进行训练、测试和模型选择。以下介绍几种常见的交叉验证方法：

1.1 简单交叉验证

简单交叉验证方法包含以下步骤：
1. 数据划分 ：随机将给定数据分为两部分，一部分作为训练集，另一部分作为测试集。例如，可将 70%的数据用作训练集，30%的数据用作测试集。
2. 模型训练 ：在各种条件下（如不同的参数数量）使用训练集训练模型，从而得到不同的模型。
3. 模型选择 ：在测试集上评估每个模型的测试误差，并选择测试误差最小的模型。

1.2 S 折交叉验证

最常用的方法是 S 折交叉验证，具体步骤如下：
1. 数据分割 ：首先，将给定数据随机划分为 S 个大小相同且不相交的子集。
2. 训练与测试 ：使用 S - 1 个子集的数据训练模型，并用剩余的子集测试模型。
3. 重复操作 ：对 S 种可能的选择重复此过程。
4. 模型选择 ：最终，选择在 S 次评估中平均测试误差最小的模型。

1.3 留一法交叉验证

S 折交叉验证的一种特殊情况是 S = N，称为留一法交叉验证，常用于数据不足的情况。这里的 N 指的是给定数据集的容量。

下面用

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。