Pytorch——model.train 和 model.eval

最新推荐文章于 2025-04-04 08:48:07 发布

转载最新推荐文章于 2025-04-04 08:48:07 发布 · 9.1k 阅读

·

12

·

Pytorch 专栏收录该内容

12 篇文章

订阅专栏

本文详细解析了PyTorch中model.train()和model.eval()两个方法的使用场景与原理，特别是在BatchNormalization和Dropout层中的不同表现。训练时使用model.train()使模型处于训练模式，而测试时使用model.eval()确保模型处于评估模式，避免了BN和Dropout在训练和测试阶段的行为差异导致的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

两条语句有固定的使用场景。

在训练模型时会在前面加上：

model.train()

在测试模型时在前面使用:

model.eval()

同时发现，如果不使用这两条语句，程序也可以运行。这两个方法是针对在网络train和eval时采用不同方式的情况，比如Batch Normalization和Dropout。

下面对这Batch Normalization和Dropout做一下详细的解析：

Batch Normalization

BN的作用主要是对网络中间的每层进行归一化处理，并且使用变换重构（Batch Normalization Transform）保证每层所提取的特征分布不会被破坏。
训练时是针对每个mini-batch的，但是在测试中往往是针对单张图片，即不存在mini-batch的概念。由于网络训练完毕后参数都是固定的，因此每个batch的均值和方差都是不变的，因此直接结算所有batch的均值和方差。所有Batch Normalization的训练和测试时的操作不同。

Dropout

Dropout能够克服Overfitting，在每个训练Batch中，通过忽略一半的特征检测器，可以明显的减少过拟合现象。
在这里插入图片描述
在训练中，每个隐层的神经元先乘以概率P，然后再进行激活。
在测试中，所有的神经元先进行激活，然后每个隐层神经元的输出乘P。

Reference:
https://blog.youkuaiyun.com/u011276025/article/details/78507950

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。