把vgg16用在单通道灰度图上

最新推荐文章于 2023-07-29 11:55:45 发布

原创

最新推荐文章于 2023-07-29 11:55:45 发布 · 9.4k 阅读

55 ·

CC 4.0 BY-SA版权

1.把vgg16用在单通道灰度图上，具体做法就是直接将第一个卷积层的输入通道改为1

附完整代码：

import torch
from torch import nn
from torchvision.models.vgg import vgg16
from PIL import Image
import torchvision.transforms as transforms
img_to_tensor = transforms.ToTensor()
from torch.autograd import Variable
import numpy as np

vgg = vgg16(pretrained=True)
#更改vgg网络的input为单通道
vgg.features[0]=nn.Conv2d(1, 64, kernel_size=3, padding=1)

def inference(model, imgpath):
    model.eval()  # 必需，否则预测结果是错误的

    img = Image.open(imgpath)
    img = img.resize((224, 224))
    tensor = img_to_tensor(img)
    tensor = tensor.resize_(1, 1, 224, 224)

    result = model(Variable(tensor))
    result_npy = result.data.cpu().numpy()  # 将结果传到CPU，并转换为numpy格式
    max_index = np.argmax(result_npy[0])

    return max_index

imgpath = 'F:\pycharmProject\SRGAN-master\grey.png'
print(inference(vgg, imgpath))

2.vgg16模型减半，以pre_trained vgg16权重作为初始权重，重新训练vgg16（思路是这样，我还没运行过，因为还没下载ImageNet数据集，大家借鉴思路就行了）

附完整代码：

import torch
from torch import nn
from torchvision.models.vgg import vgg16
from PIL import Image
import torchvision.transforms as transforms
import torchvision.datasets as dsets
img_to_tensor = transforms.ToTensor()
from torch.autograd import Variable
import numpy as np
import torch.optim as optim

EPOCH=50
BATCH=4
LEARNING_RATE = 0.01

#process data
transform = transforms.Compose([
    transforms.RandomSizedCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize(mean = [ 0.485, 0.456, 0.406 ],
                         std  = [ 0.229, 0.2

最低0.47元/天解锁文章

9 条评论

cc6660228 2023.07.19
请问作者应用灰度图成功了嘛？

qq_42972859 2022.08.26
请问如果把VGG网络第一个卷积层的输入通道数改为1，怎么使用预训练的VGG模型的权重参数呢？预训练的模型输入应该是三通道的呀？
- weixin_47634619回复认真学习！！！ 2023.07.18
  请问现在解决了吗
- 认真学习！！！回复xiaopingpingping 2023.02.19
  同求，请问有没有解决方法
- xiaopingpingping回复qq_42972859 2023.01.18
  请问改好了嘛？求问