基于卷积神经网络的猫狗图像分类
1. 卷积层超参数
卷积层有两个主要的超参数:
- 滤波器数量 :之前的例子只用了一个滤波器,增加滤波器数量可以找到更多特征。
- 滤波器大小 :之前用的是 3x3 滤波器,调整大小可表示更大特征。
2. 最大池化
在卷积神经网络(CNNs)中,通常在卷积层后紧跟最大池化层。其目的是减少卷积层后的权重数量,降低模型复杂度,避免过拟合。具体操作是查看输入的每个子集,只保留最大值。例如,输入是 4x4 张量,使用 2x2 最大池化层,会将输入的每个 2x2 区域中除最大值外的其他值丢弃,有效将输入的高度和宽度减半。
3. CNNs 的基本架构
CNNs 通常由卷积层和池化层堆叠而成,卷积层常用的激活函数是 ReLU。最终层是全连接层(密集层),使用 sigmoid 或 softmax 激活函数。sigmoid 用于二分类问题,softmax 用于多分类问题。早期层负责识别特征,全连接层负责预测。
4. 现代 CNNs 回顾
- LeNet (1998) :由 Yann LeCun 开发,首次证明 CNNs 在图像识别(特别是手写数字识别)中的有效性,但在 2000 年代进展缓慢。
- AlexNet (2012) :由 Alex Krizhevsky 等人开发,用于赢得 2012 年的 ILSVRC 竞赛。基于 LeNet 原理,但架构更深,可训练参数约 6000
超级会员免费看
订阅专栏 解锁全文
868

被折叠的 条评论
为什么被折叠?



