题目:PP-YOLO: An Effective and Efficient Implementation of Object Detector
作者:Xiang Long, Kaipeng Deng, Guanzhong Wang, Yang Zhang, Qingqing Dang,Yuan Gao, Hui Shen, Jianguo Ren, Shumin Han, Errui Ding, Shilei Wen
(百度团队)
motivation: 还是速度和效果不能兼得的问题,作者想兼得速度与效果。在yolo系列的基础上,采用多种tricks,在不增加计算量的基础上提高效果。
这篇文章和yolov4一样,融合tricks高,实验效果好。
methods:
-
ResNet50-vd 替换 darknet53, 为了避免换了带来的性能降低,换resnet50-vd中的部分卷积为可变形卷积Deformable Convolutional Networks (DCN) 。DCN太多会影响推断时间,因此只用DCNs换了最后阶段的33卷积.DCN:本身不会显著增加模型中参数和FLOPs的数量,但是可能会影响推断时间
-
FPN为neck
-
head 几乎不变
tricks:
- Larger Batch Size (64-192)大公司卡多!
- EMA
- Dr