卷积神经网络与手写数字分类实践
1. 卷积神经网络基础
1.1 卷积层结构
卷积神经网络由一系列卷积层组成,每一层的输出作为下一层的输入。例如,我们可以通过一个三层卷积网络来分析输入候选图像,其结构如下:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(输入):::process --> B(第一层卷积层 - T, Q, L, R 滤波器):::process
B --> C(第二层卷积层 - E, N, M 滤波器):::process
C --> D(第三层卷积层 - F, P 滤波器):::process
D --> E(输出):::process
1.2 滤波器应用
以一个 12x12 的候选图像为例,应用第一层的滤波器。如使用 2x2 的 T 滤波器对其进行卷积操作:
- 由于 T 滤波器没有中心,将其锚点置于左上角。
- 不进行填充,滤波器为 2x2,输出为 11x11 的 T - map。在 T - map 中,T 滤波器完全匹配的位置标记为浅绿色,否则标记为粉色。
1.3 池化操作
为使滤波器对输入的小位移具有鲁棒性,使用 2x2 的最大池化。对 T - map 进行最大池化操作:
- 对于每个 2x2 块,如果块中至少有一个绿色值,输出为绿色(绿色元素值为 1,红色为 0)。
- 池化块超出
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



