Yolo系列之Yolo的基本理解

YOLO的基本理解

1 YOLO


1.1 概念

YOLO(You Only Look Once)是一种基于深度学习目标检测算法,由Joseph Redmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题通过一个神经网络直接预测目标的类别和位置

1.2 算法

YOLO算法将输入图像分成nxn个网格每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外,YOLO算法还采用了多尺度特征融合的技术,使得算法能够在不同尺度下对目标进行检测。相比于传统的目标检测算法,如R-CNN、Fast R-CNN和FasterR-CNN等,YOLO算法具有更快的检测速度和更高的准确率。这得益于其端到端训练方式和单阶段检测的特性,使其可以同时处理分类和定位任务,避免了传统方法中的多阶段处理过程。因此,YOLO算法广泛应用于实时目标检测和自动驾驶等领域。

2 单、多阶段对比


2.1 FLOPs和FPS

FLOPs:表示模型进行一次前向传播(即处理一张图像)所需要的浮点运算次数。它是一个衡量算法效率的关键指标,与模型的计算量和推断速度密切相关。
FPS:每秒可以处理的图像数量

2.2 one-stage单阶段

one-stage用于YOLO系列
在这里插入图片描述

  • 优缺点:
    • 优点:识别速度非常快,适合做实时检测
    • 缺点:正确率相比较低

2.3 two-stage两阶段

两阶段目标检测器是一种先生成候选框,然后对候选框进行分类和回归的检测方法。这种方法主要包括两个阶段:

  • 第一阶段:生成候选框。这通常通过一个类似于selective search或EdgeBoxes等区域提名算法来实现,该算法从输入图像中生成多个候选框。每个候选框都会经过一个CNN模型进行特征提取,然后通过分类器进行过滤,保留与目标物体更相似的候选框。
  • 第二阶段:在保留的候选框上进行精细的分类和回归。这个阶段通常使用另一个CNN模型或类似SVM的分类器来进行分类和回归。对于每个候选框,可能需要预测物体的类别、位置和大小等。
  • 代表性的两阶段目标检测器包括R-CNN系列,以及其改进版本Fast R-CNN、Faster R-CNN和Mask R-CNN等。
  • 优缺点:
    • 优点:正确率比较高,识别效果理想
    • 缺点:识别速度比较慢,通常达到5FPS
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值