Pytorch：卷积神经网络-空洞卷积

宅家的小魏

已于 2022-02-13 17:20:10 修改

阅读量9.6k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： cnn pytorch 深度学习卷积计算机视觉

于 2022-02-04 00:04:45 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_44979150/article/details/122778696

本文介绍了如何使用PyTorch搭建空洞卷积神经网络，通过空洞卷积增大感受野，提升模型的特征捕获能力。网络结构包括两个空洞卷积层、两个池化层和两个全连接层，应用于FashionMNIST数据集。训练过程展示，模型在验证集上达到高精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Pytorch: 空洞卷积神经网络

Copyright: Jingmin Wei, Pattern Recognition and Intelligent System, School of Artificial and Intelligence, Huazhong University of Science and Technology

Pytorch教程专栏链接

文章目录

Pytorch: 空洞卷积神经网络

@[toc]

空洞卷积神经网络搭建

数据预处理

空洞卷积神经网络的训练和预测

本教程不商用，仅供学习和参考交流使用，如需转载，请联系本人。

相对于普通卷积，空洞卷积通过在卷积核中添加空洞( $0$ 元素)，从而增大感受野，获取更多信息。感受野为在卷积神经网络中，决定某一层输出结果中一个元素对应的输入层的区域大小，通俗解释就是特征映射上的一个点对应输入图上的区域大小。

对于一个 $3\times3$ 的 $2$ -空洞卷积运算，实际的卷积核大小还是 $3\times3$ 。但是空洞为 $1$ ，这样卷积核就会扩充一个 $7\times7$ 的图像块，但只有 $9$ 个红色的点会有权重取值进行卷积操作。也可以理解为卷积核的大小为 $7\times7$ ，但只有图中的 $9$ 个点的权重不为 $0$ ，其他均为 $0$ 。实际卷积权重只有 $3\times3$ ，但感受野实际为 $7\times7$ 。对于 $15\times15$ 的，实际卷积只有 $9\times9$ 。

在 nn.Conv2d() 函数中，调节 dilation 的取值，即可进行不同大小卷积核的空洞卷积运算。

我们搭建的空洞卷积神经网络有两个空洞卷积层，两个池化层和两个全连接层，分类器依旧包含 $10$ 个神经元，除了卷积方式差异，与前文识别 FashionMNIST 的网络结构完全相同。

空洞卷积神经网络搭建

import numpy as np
import pandas as pd
from sklearn.metrics import accuracy_score, confusion_matrix
import matplotlib.pyplot as plt 
import seaborn as sns 
import copy 
import time
import torch
import torch.nn as nn
from torch.optim import Adam
import torch.utils.data as Data 
from torchvision import transforms 
from torchvision.datasets import FashionMNIST

class MyConvDilaNet(nn.Module):
    def __init__(self):
        super(MyConvDilaNet, self).__init__()
        # 定义第一层卷积
        self.conv1 = nn.Sequential(
            nn.Conv2d(
                in_channels = 1,    # 输入图像通道数
                out_channels = 16,   # 输出特征数(卷积核个数)
                kernel_size = 3,    # 卷积核大小
                stride = 1,     # 卷积核步长1
                padding = 1,    # 边缘填充1
                dilation = 2,
            ),
            nn.ReLU(),  # 激活函数
            nn