关于用nn.Parameter自建模型问题

最新推荐文章于 2025-06-04 10:15:16 发布

原创最新推荐文章于 2025-06-04 10:15:16 发布 · 558 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #机器学习 #人工智能

本文讨论了在使用PyTorch开发自定义模型时遇到的问题，包括参数绑定、设备迁移和性能差距。作者分享了如何处理参数转换、使用ModuleList和ModuleDict，以及发现官方库在某些情况下性能更优的原因，可能涉及到并行化和资源管理问题。

部署运行你感兴趣的模型镜像

这篇文章用于记录学习遇到的bug，以便后续查看。细节描述不够详尽，若遇到相似的问题，可以在评论区交流。

如何用公式创建自己的模型

让自定义类继承自nn. Module，在init中直接创建nn. Parameter类成员变量，就会自动绑定到model. parameters中，可以通过调用parameters方法查看。
在绑定的时候我遇到两个问题：

参数不能to(device)，不然会绑定不上，而且模型在to gpu的时候参数自然会转到上面，但是子模块有没有to(device)没有影响（平时写Linear也不会在定义模块后面加上一句to(device)吧）
如果是把参数定义成list，或者dict，默认是不会绑定到模型中的，需要把类型改成nn. ParamList或ParamDict
如果是把子模块（或者叫层）定义成list，需要使用ModuleList和ModuleDict
注：2，3两种情况多见于模块本身支持multiple layers
修改了以上的问题，梯度正常下降了！

发现效果不如官方库好

我正在做的两个模型，DCSN和LSTM，我都直接用代码实现了其功能，发现他们在cpu上的运行效率比官方提供的nn. LSTM慢了很多，有人解释说是nn. LSTM底层使用了c/c++代码，所以效率会更高。
但是我的模型在gpu下比cpu还慢，但官方库没有这个问题，我认为是我的并行化做得不好，而且在一些不必要的地方切换gpu与cpu会损耗时间。

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

那時年少°378

博客等级

码龄5年

18
原创

88
点赞

99
收藏

53
粉丝

关注

私信

热门文章

分类专栏

nodemcu esp8266 mp制作 12篇
笔记 4篇

上一篇：: 递归是什么

最新评论

关于用nn.Parameter自建模型问题
优快云-Ada助手: 恭喜您发布了第18篇博客！看到您探讨关于使用nn.Parameter自建模型的问题，我感到很欣慰。您的研究方向非常有深度，对深度学习领域的探索让人佩服。接下来，我建议您可以尝试结合实际案例，深入探讨nn.Parameter在不同场景下的应用，或者探讨其与其他参数化方法的比较，这样会更有助于读者的理解与学习。期待您的下一篇作品！祝您创作顺利！

大家在看

最新文章

AI算力推荐

PyTorch 2.6

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

PyTorch

Cuda

目录

展开全部

收起

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。