论文笔记:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Andrew

MobileNets提出深度可分离卷积,通过减少计算量,保持高准确度,适用于移动设备。文章介绍了网络结构及两个超参数α和ρ,用于调整网络规模和计算需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文笔记:MobileNets

简介

这篇文章提出了一个轻量级网络,应用深度可分离卷积代替标准卷积,大幅减少了计算量,同时准确度没有受到太大的影响。此外,文中提出了两个超参数以满足

方法

对于一个
在这里插入图片描述

图中,输入特征F的尺寸为 ( D F , D F , M ) (D_F,D_F,M) (DF,DF,M),采用的标准卷积K的尺寸为 ( D K , D K , M , N ) (D_K,D_K,M,N) (DK,DK,M,N)(如图所示),输出特征G的尺寸为 ( D G , D G , N ) (D_G,D_G,N) (DG,DG,N)。标准卷积的计算公式如下:
在这里插入图片描述
输入特征的通道数为M,输出特征的通道数为N,所以对应的计算量为 。深度可分离卷积将标准卷积拆分成深度卷积与逐点卷积两步:
λ 深度卷积主要负责滤波,滤波器尺寸为 ( D K , D K , 1 , M ) (D_K,D_K,1,M) (DK,DK,1,M),如图4.7 b所示。输出的特征尺寸为 ( D G , D G , M ) (D_G,D_G,M) (DG,DG,M)
λ 逐点卷积主要负责转换通道,滤波器尺寸为(1,1,M,N),如图4.7 c所示。输出的特征尺寸为 ( D G , D G , N ) (D_G,D_G,N) (DG,DG,N)
深度卷积的计算公式如下:

在这里插入图片描述

其中是深度卷积,卷积核尺寸为(),其中的第m个卷积核作用在F中第m个通道上,产生上第m个通道输出。由此可得深度卷积和住店卷积的计算量为在这里插入图片描述。而直接进行标准卷积的计算量为在这里插入图片描述,二者的比值为:
在这里插入图片描述
由此可知,在把标准卷积替换为深度可分离卷积后,运算量大幅减小。

MobileNet网络结构如图所示:
在这里插入图片描述

除此之外,引入 α \alpha α ρ \rho ρ两个超参数来进一步减小计算量,同时方便开发者根据自己实际的资源DIY。其中, α \alpha α表示网络尺寸减小的比例,每一层的输入通道数和输出通道数都减小为原来的 α \alpha α倍,从而计算量变成:
在这里插入图片描述

ρ \rho ρ表示输入图像分辨率减小的比例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值