Pytorch在已有网络基础上微调

最新推荐文章于 2024-10-09 18:59:33 发布

原创最新推荐文章于 2024-10-09 18:59:33 发布 · 1.1k 阅读

2 ·

CC 4.0 BY-SA版权

python 同时被 3 个专栏收录

32 篇文章

订阅专栏

31 篇文章

订阅专栏

Pytorch

20 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

这个问题应该很简单，而且之前看过类似的demo，结果忘干净了，现在只实现了一个比较naive的方法。

我们以vgg为例，假定我们的网络继承自VGG，那么

from torchvision.models.vgg import VGG

class DemoNet(VGG):
    def __init__(self):
        super().__init__
        self.load_state_dict(models.vgg16(pretrained=True).state_dict())

但如果我们的期望的输入通道数不为3，那么上述最后一行就会出现错误，提示尺寸不匹配。我们可以先将其输入层砍掉，然后限制load_state_dict时不需要完全匹配，即 strict=False。代码更改为

from torchvision.models.vgg import VGG

class DemoNet(VGG):
    def __init__(self):
        super().__init__
        del self.features[0]
        self.load_state_dict(models.vgg16(pretrained=True).state_dict(), strict=False)

以上可以加载模型，但与我们期望的还差一点，就是没有输入层。比较笨的解决办法是在此基础上添加输入层，如下

from torchvision.models.vgg import VGG

class DemoNet(VGG):
    def __init__(self):
        super().__init__
        del self.features[0]
        self.load_state_dict(models.vgg16(pretrained=True).state_dict(), strict=False)            

        temp = [nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1)]
        for i in list(self.features):
            temp.append(i)
        self.features = nn.Sequential(*temp)

印象中有简单的方法，这里先记录下来，后续会了再添加。

您可能感兴趣的与本文相关的镜像