ACEnet:用于图像分类的改进卷积神经网络架构
1. 神经网络基础层介绍
在卷积神经网络(CNN)中,有几个关键的基础层起着重要作用:
- 卷积层 :卷积层的输出体积大小由输入体积决定。设 $E$ 为沿 $D_c$ 方向的内核深度,$[W_f, H_f]$ 是进行卷积计算的区域大小,$(S_x, S_y)$ 定义了连续卷积之间跳过的像素数。输出体积大小定义为 $(H_c^{out}, W_c^{out}, D_c^{out})$,其中各维度与输入体积的关系为:$W_c^{out} = \frac{W_c^{in} - E + 2P}{S_x} + 1$,$H_c^{out} = \frac{H_c^{in} - E + 2P}{S_y} + 1$,$D_c^{out} = k$。
- 池化层 :池化层的目的是缩小卷积层的输出,从而减少提取特征的维度,同时保留其编码的信息。它接收大小为 $(W_p^{in}, H_p^{in}, D_p^{in})$ 的输入体积,使用具有空间扩展 $(F, [W_f, H_f])$ 和步长 $(S_x, S_y)$ 的一组滤波器进行处理。输出体积大小定义为 $(H_p^{out}, W_p^{out}, D_p^{out})$,各维度与输入体积的关系为:$W_p^{out} = \frac{W_p^{in} - F}{S_x} + 1$,$H_p^{out} = \frac{H_p^{in} - F}{S_y} + 1$,$D_p^{out} = D_p^{in}$。
- 全连接层 :该层计算池化层输出的加权和,若没有池化层,则计算卷积层输出的