[论文阅读]:PP-YOLO: An Effective and Efficient Implementation of Object Detector

PP-YOLO是百度团队提出的一种在不增加计算量的情况下提升目标检测速度和效果的方法。通过使用ResNet50-vd替换darknet53,并结合Deformable Convolutional Networks (DCN),FPN neck和一系列优化技巧,如Larger Batch Size、EMA、DropBlock等,实现了性能的提升。此外,文章还引入了IoU Loss、IoU Aware、Grid Sensitive、Matrix NMS、CoordConv和SPP等策略,以及更好的预训练模型。实验结果显示了这些改进的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:PP-YOLO: An Effective and Efficient Implementation of Object Detector
作者:Xiang Long, Kaipeng Deng, Guanzhong Wang, Yang Zhang, Qingqing Dang,Yuan Gao, Hui Shen, Jianguo Ren, Shumin Han, Errui Ding, Shilei Wen
(百度团队)

motivation: 还是速度和效果不能兼得的问题,作者想兼得速度与效果。在yolo系列的基础上,采用多种tricks,在不增加计算量的基础上提高效果。

这篇文章和yolov4一样,融合tricks高,实验效果好。
在这里插入图片描述

methods:

  • ResNet50-vd 替换 darknet53, 为了避免换了带来的性能降低,换resnet50-vd中的部分卷积为可变形卷积Deformable Convolutional Networks (DCN) 。DCN太多会影响推断时间,因此只用DCNs换了最后阶段的33卷积.DCN:本身不会显著增加模型中参数和FLOPs的数量,但是可能会影响推断时间

  • FPN为neck

  • head 几乎不变

tricks:

  • Larger Batch Size (64-192)大公司卡多!
  • EMA
  • Dr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值