建立深度学习验证和测试数据集

本文探讨了深度学习中的过拟合问题,介绍了训练集、验证集和测试集的作用,并强调了适当选择batch_size的重要性。作者提到Pytorch中数据加载器的默认设置,并提供了调整批量大小和数据采样的Pytorch文档链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度学习经常需要面临一个过拟合(overfitting)的问题:你的模型确实能很好地识别所训练的数据,不过不能泛化到它没有见过的例子。比如,它看到一个猫的图像后,除非所有其他猫图像都与这个图像非常相似,否则模型不会认为那是猫。为了防止这种问题的发生,所以我们就需要一个数据集来确保我们的网络没有问题。
这里再说一下数据集类型
训练集
在训练过程中用来更新模型
验证集
用来评价模型在这个问题领域的泛化能力,而不是与训练数据拟合程度;不用来直接更新模型。
Test set
最后一个数据集,训练完成后对模型的性能提供最后的评价。
batch_size
理论上讲,我们可以把batch_size设置为测试和训练集中的图像数,使网络在更新之前会看到每一个图像。但在实际中,我们不会这样做,因为与存储数据集中每一个图像的所有相关信息相比,较小批量(mini-batches)需要的内存更少,而且更小的批量也会使训练速度更快,以便我们可以更快地更新网络。
Pytorch中数据加载器将batch_size默认设置为1。
如果有小伙伴还想要研究可以使用多大的小批量而不会耗尽GPU的内存。另外,还可以指定数据集如何采样,每次运行时是否将整个数据集打乱,另外从数据集取数据需要使用多少个进程。这些内容可以在Pytorch文档中都可以找到,这里给出链接:https://oreil.ly/XORsl
:文章摘选自《基于Pytorch的深度学习》Ian Pointer著

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

毛毛真nice

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值