YOLO系列(二)—— YOLO9000:Better, Faster, Stronger

本文深入探讨YOLOv2的目标检测技术,介绍其相较于YOLO的七大改进,包括全卷积结构、BatchNormalization应用、高分辨率训练、AnchorBoxes引入、多尺度特征融合等,旨在提供更准确、快速的物体识别方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本系列分为三篇,此文为本系列第二篇,其他文章:
YOLO系列(一)—— You Only Look Once:Unified, Real-Time Object Detection
YOLO系列(三)—— YOLOv3: An Incremental Improvement

project: https://pjreddie.com/darknet/yolo/
paper: YOLO9000:Better, Faster, Stronger
yolo v2在yolo的基础上做了一些改进,对yolo不熟悉的可以参考:YOLO系列(一)

在paper中,并没有给出网络结构的完整示意图,下图是在网上找的,原网址查看更加清晰:https://ethereon.github.io/netscope/#/gist/d08a41711e48cf111e330827b1279c31
在这里插入图片描述

相对yolo做出的修改:
1)去掉全连接层,采用全卷积结构,可以输入不同的尺寸结构(32的倍数即可,下采样率为32)
2)在每个卷积层中加入Batch Normalization,去掉dropout
3)开始训练时就采用448×448的高分辨率进行训练
4)使用了Anchor Boxes,每个grid预测5个boxes,一共可以预测13×13×5=845个boxes,且每个box都有对应的class,远多于yolo的98个boxes,以及每个grid一个class
5)Anchor Boxes由聚类生成,评价标准为IOU
6)使用多尺度特征,将两层前的feature reorganization后和当前层进行concate
7) box的预测在之前的基于Anchor的方式上做了一定修改,如下图所示
在这里插入图片描述

YOLO系列(三)—— YOLOv3: An Incremental Improvement

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值