参考博客:https://blog.youkuaiyun.com/qixutuo6087/article/details/88822428
pytorch代码:https://github.com/pppLang/SKNet
1. 为什么提出该网络?
当我们在距离目标不同远近程度看一个物体时,我们的视觉皮层神经元会选择不同的接受域来感受该物体。因此,本文提出一种动态选择机制使每一个神经元可以针对目标物体的大小选择不同的感受野。
每一个SK单元中用不同的卷积核提取特征,然后通过每个分支引导的不同信息构成的softmax进行融合。SK单元包括三个方面:Split, Fuse, Select。它的优点在于可以捕捉到不同尺寸的目标物体。
Split阶段使用不同的卷积核对原图进行卷积。
Fuse运算符组合并聚合来自多个路径的信息,以获得选择权重的全局和综合表示。
Select运算符根据选择权重聚合不同大小的内核的特征映射。
多个SK单元组成了SKNet。
2. SKNet模型
2.1 Split
首先对输入用不同的卷积核进行卷积操作。在本文,选取的3x3和5x5卷积