Pytorch框架学习记录7——卷积层

最新推荐文章于 2024-05-16 22:32:27 发布

Yozu_Roo

最新推荐文章于 2024-05-16 22:32:27 发布

阅读量272

点赞数

分类专栏： Pytorch学习笔记文章标签： pytorch 学习深度学习

本文链接：https://blog.youkuaiyun.com/qq_45955883/article/details/126060031

版权

Pytorch学习笔记专栏收录该内容

14 篇文章

订阅专栏

Pytorch框架学习记录7——卷积层

1. torch.nn.Conv2d 介绍

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’, device=None, dtype=None)

参数

in_channels ( int ) – 输入图像中的通道数
out_channels ( int ) – 卷积产生的通道数
kernel_size ( int or tuple ) – 卷积核的大小
stride ( int or tuple , optional ) – 卷积的步幅。默认值：1
padding ( int , tuple或str , optional ) – 添加到输入的所有四个边的填充。默认值：0
padding_mode (字符串*,*可选) – 'zeros', 'reflect', 'replicate'或'circular'. 默认：'zeros'
dilation ( int or tuple , optional ) – 内核元素之间的间距。默认值：1
groups ( int , optional ) – 从输入通道到输出通道的阻塞连接数。默认值：1
bias ( bool , optional ) – If True，向输出添加可学习的偏差。默认：True

输入图像高度和宽度与输出图像的高度和宽度计算公式：
$H_{out}=⌊(H_{in}+2×padding[0]−dilation[0]×(kernel\_size[0]−1)−1)/stride[0]+1⌋$

$W_{out}=⌊(W_{in}+2×padding[1]−dilation[1]×(kernel\_size[1]−1)−1)/stride[1]+1⌋$

这里的output_channels就代表着卷积核的个数，卷积核的个数=输出频道的个数

2. 实例

下面的实例就使用之前学习到的方法构建了一个简单的卷积网络，并对输入输出图像进行展示对比。

import torch
import torchvision.datasets
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10(root='./dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)

dataloader = DataLoader(dataset=dataset, batch_size=64, num_workers=0)


class Test(nn.Module):
    def __init__(self):
        super(Test, self).__init__()
        self.conv2d = nn.Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

    def forward(self, x):
        x = self.conv2d(x)
        return x


writer = SummaryWriter("logs")
test = Test()
step = 0
for data in dataloader:
    imgs, target = data
    output = test(imgs)
    print(imgs.shape)
    print(output.shape)
    output = torch.reshape(output, (-1, 3, 30, 30))

    writer.add_images("input", imgs, step)
    writer.add_images("output", output, step)
    step += 1