这个问题应该很简单,而且之前看过类似的demo,结果忘干净了,现在只实现了一个比较naive的方法。
我们以vgg为例,假定我们的网络继承自VGG,那么
from torchvision.models.vgg import VGG
class DemoNet(VGG):
def __init__(self):
super().__init__
self.load_state_dict(models.vgg16(pretrained=True).state_dict())
但如果我们的期望的输入通道数不为3,那么上述最后一行就会出现错误,提示尺寸不匹配。我们可以先将其输入层砍掉,然后限制load_state_dict时不需要完全匹配,即 strict=False。代码更改为
from torchvision.models.vgg import VGG
class DemoNet(VGG):
def __init__(self):
super().__init__
del self.features[0]
self.load_state_dict(models.vgg16(pretrained=True).state_dict(), strict=False)
以上可以加载模型,但与我们期望的还差一点,就是没有输入层。比较笨的解决办法是在此基础上添加输入层,如下
from torchvision.models.vgg import VGG
class DemoNet(VGG):
def __init__(self):
super().__init__
del self.features[0]
self.load_state_dict(models.vgg16(pretrained=True).state_dict(), strict=False)
temp = [nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1)]
for i in list(self.features):
temp.append(i)
self.features = nn.Sequential(*temp)
印象中有简单的方法,这里先记录下来,后续会了再添加。