深度学习目标检测在实际场景中的应用(附源代码)

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

目标检测是现在最热门的研究课题,目前最流行的还是Yolo系列框架,最近我们计算机视觉研究院也分享了很对目标检测干活及实践,都是Yolo-Base框架,今天我们分享一个经过修改后的Yolov5,实时检测的效果!

开源代码:https://github.com/ultralytics/yolov5/releases

01

a89bc7bd7d97cb8b6e0a1e3908bc6a3a.png

前言

b4c9090f2e74fffb8b61b62390ef7088.png

目标检测是现在最热门的研究课题,现在的框架越来越多,但是技术的新颖性到了瓶颈,目前开始流行Transformer机制,而且在目标检测领域也能获得较大的提升,也是目前研究的一个热点。

307255304fdd6584e2067681f524964a.jpeg

即将举行的亚运会,将会投入更多的先进科技,比如3D成像、姿态估计、目标检测、跟踪及识别!让去全世界看到不一样的中国,不一样的科技,不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现!

73f8a50530de564ac26c2e32c0224551.jpeg

ae7198245034ac8d22558bab4c2b1a10.png

目前最流行的还是Yolo系列框架,最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践,都是Yolo-Base框架。

  • 高斯YoloV3目标检测(文中供源码链接)

  • Yolo轻量级网络,超轻算法在各硬件可实现工业级检测效果(附源代码)

  • 不再只有Yolo,现在轻量级检测网络层出不穷(框架解析及部署实践)

  • CVPR21目标检测新框架:不再是YOLO,而是只需要一层特征(干货满满,建议收藏)

02

37fa3008535dcaa68d9b7ac12ff11591.png

新框架改进

9e298a7ab4ab0fc47daca26adaa41824.png

今天我们分享一个经过简单优化过的Yolov5,暂时命名为:Pad-YoloV5,在IPad上可以实时检测!基于YoloV5框架,熟悉的同学应该都不用多加解释。

YoloV4在YoloV3的基础上增加了近两年的研究成果,如下:

  1. 输入端采用mosaic数据增强

  2. Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。(cspnet减少了计算量的同时可以保证准确率)

  3. Mish函数为:

    8d9861a7659ee3e876c0cecda01ff3db.png

  4. Neck中采用了SPP、FPN+PAN的结构,

  5. 输出端则采用CIOU_Loss、DIOU_nms操作

YoloV5主要的改变,如下:

  1. 输入端:Mosaic数据增强、自适应锚框计算

  2. Backbone:Focus结构,CSP结构

  3. Neck:FPN+PAN结构

  4. Prediction:GIOU_Loss

这次主要优化,是YoloV5在数据增强的时候,用随机缩放、随机裁剪、随机排布的方式进行拼接,这个对于小目标的检测效果还是很友好的。通过实验发现,这个随机拼接和有规律的拼接,最终的结果还是有一点差别的。

30382f8da9f818e83e685c09d409d708.png

首先我通过修改数据增强的策略,开始对整体数据集进行统计(也就是数据预处理分析),我大致分成三个范围。将最大的与最小的进行随机拼接,最终结果确实比整体随机的效果好!

96f536ef818a879a1b5e9425e709a854.png

其次,稍微修改了下自适应图片缩放策略,Yolov5代码中datasets.py的letterbox函数中进行了修改,对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片,我在右下角位置填边,其实大多数数据没有什么变化,只是随便改改,因为在线都是在Yolo的基础上增加最近几年新出的策略,确实在最后的检查有一定效果的增加。

最后的修改,就是辛苦的把Transformer机制加进了YoloV5的基础框架中,训练确实加快了,但是对于用笔记本训练的成果物,还是不够明显。这也是最近第一次分享实践过程的一些小心思,具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享!

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇


 

a1aaad14c08270fdb6739f71d1b898b1.jpeg

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值