深度学习总结(八)——训练、开发和测试集及偏差和方差

本文介绍了深度学习中数据集的划分,包括小数据时代和大数据时代的划分比例。强调了验证集和测试集的作用,确保它们与训练集分布一致以优化模型性能。同时,讨论了偏差和方差的概念,如何通过训练集和验证集来调整模型以平衡两者。深度学习的一大优势在于,它允许我们在不牺牲泛化能力的情况下减少对偏差和方差平衡的关注。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这里写图片描述


1. 数据集的划分

小数据时代: 70%(训练集)/30%(测试集)或者60%(训练集)/20%(验证集)/20%(测试集)
大数据时代: 验证集和测试集的比例要逐渐减小,比如:
980000/10000/10000

2. 验证集和测试集的作用

深度学习需要大量的数据,我们可能会采用网上爬取的方式获得训练集,容易出现训练集和验证集、测试集分布不一致的情况,由于验证集的目的就是为了验证不同的算法,选取效果好的。所以确保验证集和测试集的数据来自同一分布可以加快训练速度,模型在测试集上也会获得较好的效果。

测试集的目的是对最终选定的神经网络系统做出无偏评估。(测试集可以不要)

没有测试集时,验证集也会被称为测试集,但是人们是把这里的测试集当成简单交叉验证集使用。

搭建训练验证集和测试集能够加速神经网络的集成,也可以更有效地衡量算法的偏差和方差。从而帮助我们更高效地选择合适的方法来优化算法。

训练集误差 1% 15% 15% 0.5%
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值