卷积神经网络架构全解析
1. 卷积神经网络架构概述
卷积神经网络(CNN)架构各有优劣,优点包括训练时间短、预测快速准确等,缺点则是对强大硬件依赖较重。下面将详细介绍几种重要的CNN架构,包括它们的起源和可能的工业应用案例。
2. 卷积神经网络架构的演进
2.1 LeNet
LeNet,也被称为lenet - 5,由法国计算机科学家Y. LeCun于1998年首次提出,最初用于文档中手写和机器印刷字符的识别。由于其架构简单小巧,LeNet所需的计算能力和存储权重的内存较少。
- 架构描述 :
- 输入层:接收32×32像素的灰度图像作为输入,输入图像的像素值被归一化到 - 0.1到1.175之间,以确保均值为0,标准差为1。
- 第一层卷积层:包含6个大小为(5×5)的滤波器,步长为(1×1),采用“same”填充,输出维度为(28×28)。
- 第二层平均池化层:步长为(2×2),输出维度为(14×14)。
- 第三层卷积层:与第一层类似,但有16个滤波器,采用“valid”填充。
- 第四层平均池化层:步长为(2×2),输出16个(5×5)的特征图。
- 第五层卷积层:有120个大小为(5×5)的滤波器,输出大小为(1×1)。若输入图像大于(32×32),该层输出维度将不是(1×1),因此定义为卷积层而非全连接层。
- 第六层全连接层:输出84个特征图。
| 层类型 | 滤波器大小 | 步长 | 填充 </ |
|---|
超级会员免费看
订阅专栏 解锁全文

757

被折叠的 条评论
为什么被折叠?



