EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

最新推荐文章于 2023-12-09 20:29:35 发布

Tinet-

最新推荐文章于 2023-12-09 20:29:35 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： paper reading 文章标签：深度学习人工智能计算机视觉网络结构设计

本文链接：https://blog.youkuaiyun.com/a237072751/article/details/90722560

paper reading 专栏收录该内容

1 篇文章

订阅专栏

本文介绍Google投稿ICML 2019的EfficientNet。指出对网络缩放可提升模型准确率，作者认为三种缩放等比例进行效果最佳，能提升精度并降低参数量。还搜索了适合的baseline模型，训练用了新trick，该方法在latency提升显著，对工业应用友好。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本次介绍一篇Google投稿与ICML 2019的工作：EfficientNet。
对网络进行缩放可以提升模型准确率，常见的方法有三种: 深度(#layers) \ 宽度(#channels) \ 输入分辨率。这三种缩放按照何种比例进行缩放能达到更好的效果尚未研究。作者三种缩放等比例进行缩放最佳，在提升精度的同时可以降低模型参数量。在ImageNet上的性能如图

方法

作者指出，三个可缩放的影响因素应该按照如下公式所示的比例进行缩放。满足 $\alpha*\beta^2*\gamma^2\approx2$ 是为了让总计算量按照 $2^\phi$ 倍增长.
在这里插入图片描述
除了上述缩放规律外，作者还搜索了一种适合该方法的baseline 模型。在模型搜索时考虑了优化准确率和模型计算量。