CNN 2.2 Classic Networks--经典的网络结构

本文介绍了三种经典的卷积神经网络——LeNet-5、AlexNet和VGG-16,包括它们的结构、历史背景以及对现代深度学习的影响。LeNet-5用于手写数字识别,AlexNet引入了ReLU激活函数,而VGG-16以其简洁的3x3卷积层设计著称。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

三种经典的网络结构

  1. LeNet-5(1998)
  2. Alex Net(2012)
  3. VGG-16(2015)

都是大佬的作品,非常经典,有时间要拜读论文呀(每张网络结构图片上都有论文信息)

LeNet-5

LeNet-5的任务
识别手写数字,因为它是在灰度图像上训练,所以图片的维度是32x32x1。

LeNet-5的结构
在这里插入图片描述
最后一件以前做现在没有再做的事是 原始LeNet-5在池化后有非线性处理 我想应是池化层后用了sigmoid非线性 所以如果你读了这篇论文 这是一篇较难的论文 与随后一些视频中讲的论文相比 随后这篇论文更容易开始 这张幻灯片中大部分算法属于论文第二三章 后面几章讨论了其他想法 即图转换网络(GTN) 该网络现在已不再广泛使用 所以如果你想读这篇论文 我推荐多关注讨论LeNet-5结构的第二章 也可以快速看下第三章 第三章很有趣 讲了实验和结果

因为年代原因LeNet-5需要重新考虑的部分

  1. LeNet-5的池化层选用的是均值pooling,现在很少用均值pooling,大部分情况下都 是使用max pooling
  2. 在这篇文章完成的1998年,人们不怎么用填充或你总用有效卷积计算。这也就是为什么每次你用卷积层结果的尺寸都会缩小。所以这就是为什么这里你会得到从14乘14降到10乘10的结果,然后接着另一池化层,因此高和宽都以2的因子降低,然后得到5乘5的结果。
  3. 作为该网络结构的现代版,我们用softmax层来生成10个分类结果,尽管LeNet-5原先是用别的分类器做输出层,而这个分类器现在已经不用了。
  4. <
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值