Training Set, Validation Set 和Testing Set之间的差别及关系

最新推荐文章于 2022-05-09 23:16:33 发布

翻译最新推荐文章于 2022-05-09 23:16:33 发布 · 1.2w 阅读

·

3

·

Machine Learning 专栏收录该内容

26 篇文章

订阅专栏

本文深入探讨了神经网络训练过程中的关键步骤，包括训练数据、验证数据和测试数据的作用，解释了如何通过调整权重和偏差来优化模型，并在训练完成后使用测试数据验证模型的泛化能力。

1. 各类数据的用途示例

训练数据和验证数据在训练时使用，基本流程如下：

for each epoch
    for each training data instance
        propagate error through the network
        adjust the weights
        calculate the accuracy over training data
    for each validation data instance
        calculate the accuracy over the validation data
    if the threshold validation accuracy is met
        exit training
    else
        continue training

训练完成之后，使用测试数据验证其准确度是否满足要求，即验证其推广/泛化能力。

2. 训练数据(Training Set)

用于调整网络的权重(weights)和偏差(biases)。

3. 验证数据(Validation Set)

验证数据用于最小化过拟合(overfitting)。

这数据不调整权重和偏差。在基于训练数据调整权重之后，如果基于训练数据的准确度增加了，而基于验证数据的准确度没有增加或反而下降了，则表明过拟合（overfitting）了，需要立即停止训练。

4. 测试数据(Testing Set)

在训练完成之后，使用测试数据确认网络真正的预测和分类能力。

5. Ground Truth

在有监督学习中，数据是有标注的，以(x, t)的形式出现，其中x是输入数据，t是标注。正确的t标注是Ground Truth，错误的标记则不是。（也有人将所有标注数据都叫做Ground Truth）

翻译自：http://stackoverflow.com/questions/2976452/whats-is-the-difference-between-train-validation-and-test-set-in-neural-networ

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。