机器学习 计算机视觉提高准确率、精确度:设计全新的算法(提出完全不同的思想 具有革命性) 设计新的网络架构(目标检测方面:对特征模块、优化模块、前处理后处理模块进行优化)
这篇论文提出了对卷积网络各个维度进行放缩 从而更大效率的提升卷积网络的性能,分别在深度、宽度和输入图片分辨率上做了分析 做了个混合系数 将三个维度联系起来
1、加深
网络层次越来越深 性能变强 但加深到一定程度时 性能提升达到饱和 flops(计算量) 越来越难训练
加深是有限度要求
2、网络宽度
网络加宽可以捕获更加细微的特征 容易训练 但是深度到一定程度 计算量也增加了很多倍
网络宽度也有一定的限制范围
3、输入图片的分辨率
分辨率变大 性能提升 但增幅逐渐变缓 计算量增大好几倍
输入图像的大小(分辨率)也是有限制要求的
所以作者提出一个系数 将三个维度平衡的放大 以提高性能
之前的文章只是探讨宽度和深度 并没有探讨分辨率的影响。
X:tensor大小
H W C:高度 宽度 通道数
F:一系列卷积操作(卷积 池化)
蓝色是基准 18层
当分辨率提升1.3倍 即黄色 性能提升
当深度提升两倍 即绿色 性能提升但不明显
当深度提升两倍 分辨率提升到1.3倍 即红色 性能提升最明显
不同维度之间不是互相独立的 而是需要平衡 需要协同控制
本文提出了以下表示方法:
结构:
参数量极小 计算量极小 准确率更高
结论:
本论文系统的分析了卷积网络的尺度 平衡了宽度 深度 分辨率 运行速度快 参数少 计算量少