23、使用卷积实现泛化：卷积神经网络的构建与训练

onion

于 2025-08-03 10:33:58 发布

阅读量30

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习实战文章标签：卷积神经网络 CNN PyTorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/onion/article/details/151034138

PyTorch深度学习实战专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

使用卷积实现泛化：卷积神经网络的构建与训练

1. 卷积网络参数与功能API

在构建神经网络模型时，我们可以通过 parameters() 方法深入访问模型中所有子模块的参数。例如：

model = Net()
numel_list = [p.numel() for p in model.parameters()]
sum(numel_list), numel_list

这里， parameters() 会递归调用所有子模块的 parameters() 方法，无论子模块嵌套多深， nn.Module 都能访问所有子参数列表。通过访问 grad 属性（由自动求导填充），优化器就能知道如何改变参数以最小化损失。

回顾 Net 类的实现，我们发现像 nn.Tanh 和 nn.MaxPool2d 这类无参数的子模块，在构造函数中注册它们显得有些多余。实际上，我们可以在 forward 函数中直接调用它们的功能对应项。

PyTorch为每个 nn 模块都提供了功能对应项，这些功能函数“无内部状态”，其输出值完全由输入参数决定。例如， nn.Linear 的功能对应项是 nn.functional.linear ，其签名为

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。