Pytorch：卷积神经网络-VGG

宅家的小魏

已于 2023-02-27 02:39:36 修改

阅读量1.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： pytorch cnn 深度学习计算机视觉神经网络

于 2022-02-04 00:25:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44979150/article/details/122778973

Pytorch: 走向深度-Visual Geometry Group Network(VGGNet)

Copyright: Jingmin Wei, Pattern Recognition and Intelligent System, School of Artificial and Intelligence, Huazhong University of Science and Technology

Pytorch教程专栏链接

文章目录

- - Pytorch: 走向深度-Visual Geometry Group Network(VGGNet)

本教程不商用，仅供学习和参考交流使用，如需转载，请联系本人。

Reference

VGG 论文原文链接

本章节需要有一定的爬虫基础知识，在下载数据集时使用了 requests 库。

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import requests
import cv2
import torch
import torch.nn as nn
import torch.nn.functional as F 
from torchvision import models
from torchvision import transforms
from PIL import Image

网络基本结构

VGGNet 探索了网络深度和性能的关系，用更小的卷积核和更深的网络结构，取得了较好的效果，是一个非常重要的网络。

主要贡献

使用具有非常小( $3 \times 3$ )卷积滤波器的架构对深度不断增加的网络进行了全面评估，这表明通过将深度提升到 $16-19$ 个权重层，可以实现对现有技术配置的显著改进。

为什么使用 $3\times3$ 卷积核？

两个 $3\times3$ 的卷积层串联相当于 $1$ 个 $5\times5$ 的卷积层，即一个像素会跟周围 $5\times5$ 的像素产生关联，可以说感受野大小为 $5\times5$ .

以此类推， $3$ 个 $3\times3$ 的卷积层串联的效果则相当于 $1$ 个 $7\times7$ 的卷积层。那为什么选择使用 $3$ 个 $3\times3$ 的卷积层而不是使用 $1$ 个 $7\times7$ 的卷积层呢？

在 $V GG$ 中，使用了 $3$ 个 $3\times3$ 卷积核来代替 $7\times7$ 卷积核，使用了 $2$ 个 $3\times3$ 卷积核来代替 $5\times5$ 卷积核。

$3$ 个串联的 $3\times3$ 的卷积层，拥有比 $1$ 个 $7\times7$ 的卷积层更少的参数，参数量是后者的 $\frac{3\times3\times3}{7\times7} = 55\%$

$3$ 个 $3\times3$ 的卷积层比 $1$ 个 $7\times7$ 的卷积层拥有更多的非线性变换，前者可以使用 $3$ 次 $R e LU$ 激活函数，而后者只能使一次，这样使得

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。