yolo系列——目标检测基本概念

一、目标检测概述

什么是目标检测?

目标检测就是框出图片中用户感兴趣的物体,并且预测物体类别
一般做法是利用滑动窗口(Sliding Wondow)

滑动窗口(Sliding Wondow)

  1. 设定一个固定大小的窗口
  2. 遍历图像中所有位置,所到之处用分类模型识别窗口中的内容
  3. 为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图片
    缺点:滑动窗口的计算成本太大

改进思路1

使用启发式算法替换窗口遍历

例如 R-CNN,Fast R-CNN 中使用 Selective Search 产生候选区域 (找出有可能存在物体的区域)依赖外部算法,相比于滑动窗口,减少了计算成本且保证了召回率。

改进思路2

减少冗余计算,使用卷积网络实现密集预测目前普遍采用的方式

用卷积一次性计算所有特征,再取出对应位置的特征完成分类。

基础知识和术语

框、边界框(Bounding Box)

框泛指图像上的矩形框,边界横平竖直
描述一个框需要 4 个像素值:
• 方式1:左上右下边界坐标 𝑙,𝑡, 𝑟, 𝑏
• 方式2:中心坐标和框的长宽 𝑥, 𝑦, 𝑤, ℎ
边界框通常指紧密包围感兴趣物体的框
检测任务要求为图中出现的每个物体预测一个边界框

以下这些概念都指某种框,用在不同的上下文中
  1. 区域(Region):框的同义词
  2. 区域提议(Region Proposal,Proposal):
    指算法预测的可能包含物体的框,某种识别能力不强的算法的初步预测结果
  3. 感兴趣区域(Region of Interest,RoI):
    当我们谈论需要进一步检测这个框中是否有物体时,通常称框为感兴趣区域
  4. 锚框(Anchor Box,Anchor):
    图中预设的一系列基准框,类似滑窗,一些检测算法会基于锚框预测边界框
交并比 ( Intersection Over Union,IOU)

交并比(IoU)定义为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标。

二、评价指标概述

2. TP、FP、TN、FN

2.1 混淆矩阵

提到TP、FP、TN、FN,首先介绍以下混淆矩阵。
混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用nnnnnn列的矩阵形式来表示。
混淆矩阵的每一代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目
例如:

表1. 多类别混淆矩阵
</
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值