深度学习之基础模型-Xception

本文介绍了Xception模型,它是Inception模块的一种简化和优化形式,利用depthwise separable convolution实现高效学习。Xception网络结构结合了ResNet的思想,并在ImageNet和JFT数据集上表现出色。实验表明,Xception在网络参数和收敛速度方面具有优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

We present an interpretation of Inception modules in convolutional neural networks as being an intermediate step in-between regular convolution and the depth wise separable convolution operation(a depth wise convolution followed by a point wise convolution).

思想

基于Inception系列网络结构的基础上,结合depthwise separable convolution
  • 假设:
    • 卷积在3个维度上进行学习,因此卷积需要既要考虑空间相关性,又要考虑channel相关性:
      • spatial dimensions(width and height)
      • channel dimension
    • corss-channel correlations和spatial correlations是充分解耦合的,没有必要将他们叠加在一起
      注:关于空间width和height解耦合可以参考Inception V3论文

思想:将Inception modul拆分成一系列操作,独立处理spatial-correlations和cross-channel correlations,网络处理起来更加简单有效

  • 首先通过‘1x1’卷积,将输入数据拆分cross-channel相关性,拆分成3或者4组独立的空间
  • 然后,通过‘3x3’或者‘5x5’卷积核映射到更小的空间上去

Q:为什么Inception module可以用depthwise separable convolution替代?

首先,对于原始的Inception模块,如Inception V3,结构如下:


这里写图片描述

模块中,基本上先通过一系列1x1卷积降维,然后再通过3x3卷积提取特征。如果我们将上述结构再进行简化,可以得到如下简化结构:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值