PyTorch入门3

最新推荐文章于 2022-09-11 14:13:26 发布

ThirteenL

最新推荐文章于 2022-09-11 14:13:26 发布

阅读量128

点赞数

本文链接：https://blog.youkuaiyun.com/qq_42169456/article/details/103639838

版权

PuTorch查看网络的结构以及参数的提取

我们使用如下的网络结构:

import torch.nn as nn
class NetWorks(nn.Module, ABC):
    def __init__(self):
        super(NetWorks, self).__init__()
        layer1 = nn.Sequential()
        layer1.add_module('conv1', nn.Conv2d(3, 32, 3, 1, padding=1))
        layer1.add_module('relu', nn.ReLU6(True))
        layer1.add_module('MaxPool1', nn.MaxPool2d(2, 2))
        self.layer1 = layer1
        
        layer2 = nn.Sequential()
        layer2.add_module('conv2', nn.Conv2d(32, 64, 3, 1, padding=1))
        layer2.add_module('relu', nn.ReLU6(True))
        layer2.add_module('MaxPool2', nn.MaxPool2d(2, 2))
        self.layer2 = layer2
        
        layer3 = nn.Sequential()
        layer3.add_module('conv3', nn.Conv2d(64, 128, 3, 1, padding=1))
        layer3.add_module('relu', nn.ReLU(True))
        layer3.add_module('MaxPool3', nn.MaxPool2d(2, 2))
        self.layer3 = layer3
        
        layer4 = nn.Sequential()
        layer4.add_module('fc1', nn.Linear(2048, 512))
        layer4.add_module('relu', nn.ReLU(True))
        layer4.add_module('fc2', nn.Linear(512, 64))
        layer4.add_module('relu', nn.ReLU(True))
        layer4.add_module('fc3', nn.Linear(64, 10))
        self.layer4 = layer4
        
        def forward(self, inputs):
            net = self.layer1(inputs)
            net = self.layer2(net)
            net = self.layer3(net)
            net = net.view(net.size(0), -1)
            out = self.layer4(net)
            return out
model = NetWorks()
print(model)

1.网络结构查看

通过print(model)我们就能够查看我们设计的网络结构如下:

2.网络结构的提取:

我们在网络上下载到的pytorch的网络模型，如果我们不需要使用该模型中的所有的层，只需要获取部分层的话，我们该如何做呢？

首先我们介绍一下nn.Moduled 几个重要的方法:

children():该方法会返回下一级模块的生成器，以我们上面模型为例那么该方法就会返回self.layer1,self.layer2,self.layer3,self.layer4的生成器，我们可以通过for
循环将该结构依次输出,我们就能查看到这些层以及这些层的参数:
moudels():该方法会返回所有的模块的迭代器，我也不知道有啥用。
name_children(),name_modules():这两个方法都不只会返回迭代器，而且还会返回该层结构的名字:下面我们来提取网络中我们需要的层。
例如提取前两层:

model = NetWorks()
children = model.children()
n_m = nn.Sequential(*list(children)[:2]) # 此处必须加*号，不然会报错[TypeError: list is not a Module subclass]
print(n_m)

如果只是提取卷积层使用如下方法就可以提取卷积层

model = NetWorks()
conv_model = nn.Sequential()
for layer in model.named_modules():
    if isinstance(layer[1], nn.Conv2d):  # isinstance用于判断是否为nn.Conv2d类型
        conv_model.add_module(layer[0], layer[1])

参数的提取以及自定义初始化

当我们不止需要提取层的结构，还需要对该层的参数进行初始化该怎么做呢？
下面我将介绍nn.Module()里面的两个跟参数有关的方法:

named_parameters():该方法会返回网络层的名字和参数的迭代器

model = NetWorks()
for param in model.named_parameters():
    print(param[0]) # 第0个元素为该层的名字，后面的是该层的参数

parameter()：该方法会返回网络的全部参数的生成器

权重初始化
因为我们提取的权重都Variable，所以只需要取出Variable的data，然后处理即可

model = NetWorks()
for m in model.modules():
    if isinstance(m, nn.Conv2d):
        nn.init.normal(m.weight.data)

这样我们就能够重新初始化权重了