个人打卡,慎看。
指路大佬:【手把手带你实战YOLOv5-入门篇】YOLOv5 模型训练_哔哩哔哩_bilibili
一、数据集
首先提到了两个概念,训练集和验证集。我机器学习0基础,于是查找了资料。
数据集一般分为三类:训练集、验证集和测试集。
- 训练集:训练模型, 用于模型拟合的数据样本。不能反映模型真实的能力。
- 验证集:模型训练过程中单独留出的样本集,需要选择超参数,可以评估不同超参数训练出的模型效果,优化模型。参与了 “人工调参” 的训练过程。
- 测试集:评估最终模型效果。
个人白话理解:训练集是普通数据;验证集是挑取一部分非训练集,人工为其添加参数,不断优化;测试集是测试包含所有数据的模型效果。
如果人工修改大部分数据的参数,速度会很慢,所以验证集只验证一部分数据,并不是所有的数据。所有数据会在测试集评定效果。
参考: