经典卷积神经网络架构深度剖析
1. 卷积神经网络的发展与评估
卷积神经网络(CNN)在测试集上能达到超过 92% 的准确率,虽未达顶尖水平,但表现相当不错,明显优于之前的密集网络。多年来,CNN 基础架构的变体不断涌现,推动了该领域的惊人进展。ILSVRC ImageNet 挑战赛的错误率是衡量这一进展的重要指标,在短短六年内,图像分类的前五错误率从超过 26% 降至不足 2.3%。前五错误率指的是系统的前五个预测中未包含正确答案的测试图像数量。
下面我们将深入了解几种经典的 CNN 架构,包括 LeNet - 5、AlexNet、GoogLeNet 和 ResNet 等。
2. LeNet - 5 架构
LeNet - 5 是最广为人知的 CNN 架构之一,由 Yann LeCun 于 1998 年创建,广泛用于手写数字识别(MNIST)。其架构如下表所示:
| Layer Type | Maps | Size | Kernel size | Stride | Activation |
| — | — | — | — | — | — |
| Out | Fully connected | 10 | – | – | RBF |
| F6 | Fully connected | 84 | – | – | tanh |
| C5 | Convolution | 120 | 1 × 1 | 5 × 5 | 1 | tanh |
| S4 | Avg pooling | 16 | 5 × 5 | 2 × 2 | 2 | tanh |
| C3 | Convolution | 16 | 10 ×
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



