Computer Vision and Pattern Recognition Nov 2016
该网络简称CE,模型的整体架构是一个编码器-解码器。
模型搭建
网络结构
- Encoder由卷积层组成(从AlexNet中分离出来的),用于提取多个feature map。 227 × 227 227\times227 227×227编码到 6 × 6 × 256 6\times6\times256 6×6×256。
- 全连接层用于在多个feature map之间传递信息(光使用Encoder的卷积层无法在一个特征图中连接所有位置)。
为了减少计算量,本网络使用的是通道全连接层。即对于多张特征图,不是一股脑的把它们全连接起来,而是每个特征图分别连接。
这样的话,假如有m个 n × n n\times n n×n的特征图,那么参数量就从原来的 m 2 n 4 m^2n^4 m2n4缩小为 m n 4 mn^4 mn