【代码规范】.train(False)和.eval()的相似性和区别

努力努力不秃头！

于 2024-07-15 21:18:05 发布

阅读量531

点赞数 5

分类专栏：老忘记的东西呀！文章标签：代码规范 python pycharm pytorch 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_49946504/article/details/140449040

版权

老忘记的东西呀！专栏收录该内容

14 篇文章

订阅专栏

【代码规范】.train(False)和.eval()的相似性和区别

文章目录

一、.train(False) 和 .eval() 的功能
二、.train(False) 和 .eval() 的区别
三、.eval()更加规范

一、.train(False) 和 .eval() 的功能

.train(False) 和 .eval() 在功能上非常相似
- 都达到将模型从训练模式切换到评估模式的目的
- 它们在使用和语义上有一些细微的区别

二、.train(False) 和 .eval() 的区别

2.1 .eval()

一个更加直观和推荐的方式来将模型切换到评估模式
- 它明确地告诉其他开发者你正在准备模型进行评估，比如验证或测试
调用 .eval() 方法会递归地遍历模型的所有子模块，并将它们的 training 标志设置为 False
这意味着任何包含训练相关行为的层，如批量归一化（Batch Normalization）和Dropout，将被设置为评估模式

2.2 .train(False)

.train(False) 是通过直接设置模型的 training 属性为 False 来实现同样的效果
- 这可能在某些情况下看起来更像是一种底层的访问
- 而 .eval() 更像是一个面向用户的API
.train() 方法本身是一个更通用的方法，它可以接受一个布尔参数
- 当参数为 True 时，它将模型设置为训练模式
- 当参数为 False 时，它将模型设置为评估模式
使用 .train(False) 时，同样会递归地遍历模型的所有子模块，将它们的 training 标志设置为 False

2.3 总结

使用起来，两个的作用是一样无差别的，仅仅是.eval()更加清晰

三、.eval()更加规范

在功能上，.eval() 和 .train(False) 的确有相同的效果，都能将模型从训练模式切换到评估模式
- 在大多数情况下，它们可以互换使用，且结果没有差异
从代码的可读性和最佳实践的角度来看，.eval() 提供了更清晰的意图表达
- 明确地告诉阅读代码的人你正在将模型设置为评估模式
  - 对团队开发和维护代码尤其重要
- 。.eval() 方法是PyTorch官方推荐用来切换模型到评估模式的方式
.train(False) 也可以达到同样的目的，但从长远来看，使用 .eval() 可以提高代码的可维护性和理解性
在实际应用中，推荐使用 .eval()，除非有特定的技术原因需要直接操作 .train() 方法

努力努力不秃头！

博客等级

码龄5年

34
原创

378
点赞

398
收藏

251
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: torchplus

下一篇：: 解决jupyter argparse报错

最新评论

【论文阅读】One Parameter Defense— Defending Against Data Inference Attacks via Differential Privacy 隐私保护
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】The Secret Revealer: Generative Model-Inversion Attacks Against Deep Neural Networks模型反转攻击
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Model Inversion Attacks that Exploit Confidence Information and Basic Countermeasures 利用模型逆向攻击
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Unstoppable Attack: Label-Only Model Inversion无条件攻击：基于条件扩散模型的只有标签模型反演
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Deep Models Under the GAN: Information Leakage from Collaborative Deep Learning GAN下：信息泄露黑盒攻击
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。