EfficientNetV2详解

最新推荐文章于 2025-03-05 00:00:00 发布

wr319714471

最新推荐文章于 2025-03-05 00:00:00 发布

阅读量1.4k

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wr319714471/article/details/131421731

版权

EfficientNetV2训练速度快，是由于引入Fused-MBConv模块，引入了渐进式学习策略

1.EfficientNetv1中存在的问题

并不是将所有的MBconv都替换成·Fused MBConv模块，而是将网络的一些浅层MB替换成Fused MB（stage1到3）

2. v2的贡献

这里的正则方法包括 dropout ，rand augment ，mixup

3. V2-s的架构

stage的卷积后跟有bn和silu激活函数

conv1中的1是主分支上第一个卷积层的扩展因子，k3*3是卷积核大小

se代表使用se结构，0.25代表se中第一个全连接层的节点个数是输入MB模块的特征矩阵的0.25

stride对应每个stage中的第一个operator，其他均为1

4.Fused MBConv

图中有se模块，但在实际搭建过程中没有（没有可能能好）

扩展因子等于1和不等于1的结构是不同的（等于1时不需要扩展，所以就少了一个卷积层）

输入特征矩阵的shape和主分支上输出特征矩阵的shape相同时才有捷径分支

有捷径分支时才有dropout层

##这里的dropout有所不同（不是以随机比例失活一定的神经元）

正向传播过程中将输入通过了一个一个block，这里每个block都可以认为是残差结构（主分支上通过f得到输出，捷径分支就是输入直接引到输出），会以一定的概率对主分支上的输出进行丢弃（整个主分支丢弃），也就相当于没有这一层，也就相当于网络是一个随机的深度了，存活概率是从1到0.5

这里的dropout层仅指FusedBM和BM中的，不包括最后一个全连接层前面的那个

参数（m和l比s多一个stage）

v2s是在baseline的基础上得到的，大概是width1.4，depth1.8 但这是不均匀缩放的，具体不知道

5.EfficientNetv2其他训练参数

trans_size 是300，是指训练过程中最大训练尺寸（但是由于采用了渐进式的学习策略，所以他的训练尺寸是会变的，最大不会超过300）

eval_size是384 验证的时候直接采用384*384大小的

dropout的0.2对应的是全局平均池化和fc之间的

最后三个数据是渐进式学习策略时使用到的超参数

在使用不同的训练图像尺寸时要使用不同强度的正则化方法

epoch小时，图像小，正则化方法弱

随着epoch增大，图像更大，正则化方法更强

博客等级

码龄2年

30
原创

1
点赞

12
收藏

1
粉丝

关注

私信

热门文章

最新评论

rnn........
优快云-Ada助手: 恭喜您完成了第20篇博客！阅读您的文章，我深刻感受到了您对于rnn的深入探讨和研究。希望您能够继续保持创作的热情，不断提升自己的技术水平。接下来，建议您可以更多地分享一些实践经验和案例分析，这将会为读者提供更多的参考和帮助。再次感谢您的分享和努力！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply20 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。