In-Place操作及onnx导出

曙光_deeplove

已于 2023-09-20 10:31:51 修改

阅读量487

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习算法部署 ONNX 文章标签： ONNX

于 2023-09-19 20:44:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yangjinyi1314/article/details/133027336

深度学习算法部署同时被 2 个专栏收录

28 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

12 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了PyTorch中的In-Place操作，这种操作能节省GPU显存但可能导致梯度计算问题。文章提醒在使用In-Place操作时要谨慎，特别是在导出ONNX模型时应避免，因为这可能引入scatterND等不被广泛支持的算子。建议使用非In-Place操作以保证模型移植性和兼容性。

本文只做本人笔记记录所用！

一、概念介绍

In-place 操作：被称为就地操作和原地操作

pytorch中原地操作的后缀为_，如.add_()或.scatter_()，

就地操作：是直接更改给定Tensor的内容而不进行复制的操作，即不会为变量分配新的内存（不分配新的对象）。Python操作类似+=或*=也是就地操作。

当然有In-Place就有out-of-place与之对应。

每个 in-place 操作实际上都需要重写计算图的实现。out-of-place只是分配新对象并保留对旧计算图的引用，而 in-place 操作则需要将所有输入的创建更改为代表此操作的函数。

二、介绍

深度学习降低显存使用量，有几种简单的方法可以减少模型占用的GPU显存

（1）更改模型的结构，比如做轻量化模型的设计，结构重参等方法，可以有效降低模型参数量

（2）模型蒸馏，从教师模型（参数量大）-》蒸馏出学生模型（参数量小）

（3）每次训练batchsize设置小一些，也可以减少显存占用量（缺点是模型需要更长的时间训练，且模型性能可能会受损）

在我们pytorch训练

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

曙光_deeplove 你的鼓励是我努力的最大源泉

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。