Xception

最新推荐文章于 2025-10-12 14:30:11 发布

原创最新推荐文章于 2025-10-12 14:30:11 发布 · 6.5k 阅读

24 ·

CC 4.0 BY-SA版权

Classification Networks 专栏收录该内容

9 篇文章

订阅专栏

1、网络结构（CVPR2017）

如果说ResNeXt是ResNet的增强版，那毫无疑问，Xception就是Inception家族的增强版，为什么？因为牛X呀。这篇文章深入分析了Inception的卷积，在Inception模块中，从跨通道的关系看，先是由一系列1*1的卷积把输入映射为3到4个分离的比原始空间小的特征图，然后从跨空间的角度看，再用3*3或者5*5的卷积对这些小的特征图进行映射（如下左图）。Inception之后的一个假设是跨通道的关系和跨空间的关系可以被充分地解耦合，这比起同时映射跨通道和跨空间而言更可取。那么问题来了，1*1的卷积映射为多少个小的特征图比较好呢？极端的情况下（如下右图），就是先用1*1的卷积映射跨通道的关系，然后每个通道进行独立地空间关系的映射。

极端情况的Inception和深度可分离卷积非常相似了，深度可分离卷积先是对每个通道独立进行跨空间的卷积，然后接着是跨通道的卷积（通常是一个1*1的卷积）来映射跨通道的关系。极端情况的Inception模块和深度可分离卷积的区别如下：1）顺序不一样，深度可分离卷积是逐通道跨空间卷积，然后才是1*1的跨通道卷积，而Inception极端情况恰好相反；2）Inception的极端情况中两种卷积之后都有激活函数ReLU，而深度可分离卷积逐通道跨空间卷积之后没有激活函数ReLU。总结来说，极端情况的Inception模块的形式为： Conv(1*1) + BN + ReLU + Depthconv(3*3) + BN + ReLU；而深度可分离卷积的形式为：Depthconv（3*3） + BN + Conv（1*1） + BN + ReLU。

下图是标准卷积和深度可分离卷积的区别：