pytorch 笔记：torchsummary、计算模型参数量

UQI-LIUWJ

已于 2024-05-29 23:06:45 修改

阅读量5.4k

点赞数 1

分类专栏： pytorch学习文章标签： pytorch 深度学习神经网络

于 2021-09-29 23:21:27 首次发布

本文链接：https://blog.youkuaiyun.com/qq_40206371/article/details/120558250

版权

pytorch学习专栏收录该内容

116 篇文章

订阅专栏

1 torchsummary

作用：打印神经网络的结构

总结给定的PyTorch模型。总结的信息包括：

1) 层名称，

2) 输入/输出形状，

3) 核形状，

4) 参数数量，

5) 操作数量（乘加操作）

1.1 参数

model	nn.Module 要总结的PyTorch模型。模型应完全处于train()或eval()模式如果层不全部处于同一模式，运行总结可能会影响批标准化或dropout统计
input_data	模型的示例输入张量（从模型输入推断数据类型） - 或 - 输入数据的形状，以List/Tuple/torch.Size形式（数据类型必须与模型输入匹配，默认为FloatTensors）。
batch_dim	输入数据的批量维度。如果batch_dim为None，则假定输入数据包含批量维度
branching	是否使用分支布局打印输出。
col_names	指定输出中要显示的列。当前支持： ("input_size", "output_size", "num_params", "kernel_size", "mult_adds") 如果未提供输入数据，只使用"num_params"。默认：("output_size", "num_params")
col_width	每列的宽度。默认：25
depth	遍历的嵌套层次数（例如Sequentials）。默认：3
device	使用此torch设备为模型和输入数据。如果未指定，使用torch.cuda.is_available()的结果。
dtypes	对于多个输入，指定两个输入的大小，并在这里指定每个参数的类型。
verbose	0（静音）：无输出 1（默认）：打印模型概要 2（详细）：详细显示权重和偏置层默认：1

1.2 举例

以pytorch笔记：搭建简易CNN_UQI-LIUWJ的博客-优快云博客中搭建的CNN为例

import torch
from torchsummary import summary

class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
 
        self.conv1=nn.Sequential(
            nn.Conv2d(
                in_channels=1,
#输入shape (1,28,28)
                out_channels=16,
#输出shape(16,28,28)，16也是卷积核的数量
                kernel_size=5,
                stride=1,
                padding=2),
#如果想要conv2d出来的图片长宽没有变化，那么当stride=1的时候，padding=(kernel_size-1)/2
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
 #在2*2空间里面下采样，输出shape(16,14,14)
        )
           
        self.conv2=nn.Sequential(
            nn.Conv2d(
                in_channels=16,
#输入shape (16,14,14)
                out_channels=32,
#输出shape(32,14,14)
                kernel_size=5,
                stride=1,
                padding=2),
#输出shape(32,7,7),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
 
        self.fc=nn.Linear(32*7*7,10)
#输出一个十维的东西，表示我每个数字可能性的权重
        
    def forward(self,x):
            x=self.conv1(x)
            x=self.conv2(x)
            x=x.view(x.shape[0],-1)
            x=self.fc(x)
            return x
    
cnn=CNN()
summary(cnn,(1,28,28))

输出的结果是这样的：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 16, 28, 28]             416
              ReLU-2           [-1, 16, 28, 28]               0
         MaxPool2d-3           [-1, 16, 14, 14]               0
            Conv2d-4           [-1, 32, 14, 14]          12,832
              ReLU-5           [-1, 32, 14, 14]               0
         MaxPool2d-6             [-1, 32, 7, 7]               0
            Linear-7                   [-1, 10]          15,690
================================================================
Total params: 28,938
Trainable params: 28,938
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.32
Params size (MB): 0.11
Estimated Total Size (MB): 0.44
----------------------------------------------------------------

2 手动计算参数量

还是使用上面说的cnn，我们结合torch的numel()方法实现之

num=0
for i in cnn.parameters():
    if i.requires_grad==True:
        num+=i.numel()
num
#28938

sum(i.numel() for i in cnn.parameters() if i.requires_grad==True)
#28938

不难发现和上面的结果是一样的