yolo系列——目标检测基本概念

原创

已于 2023-08-17 21:23:10 修改 · 485 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#YOLO #目标检测 #人工智能

于 2023-08-01 17:18:35 首次发布

一、目标检测概述

什么是目标检测？

目标检测就是框出图片中用户感兴趣的物体，并且预测物体类别
一般做法是利用滑动窗口（Sliding Wondow）

滑动窗口（Sliding Wondow）

设定一个固定大小的窗口
遍历图像中所有位置，所到之处用分类模型识别窗口中的内容
为了检测不同大小、不同形状的物体，可以使用不同大小、长宽比的窗口扫描图片
缺点：滑动窗口的计算成本太大

改进思路1

使用启发式算法替换窗口遍历

例如 R-CNN，Fast R-CNN 中使用 Selective Search 产生候选区域（找出有可能存在物体的区域）依赖外部算法，相比于滑动窗口，减少了计算成本且保证了召回率。

改进思路2

减少冗余计算，使用卷积网络实现密集预测目前普遍采用的方式

用卷积一次性计算所有特征，再取出对应位置的特征完成分类。

基础知识和术语

框、边界框（Bounding Box）

框泛指图像上的矩形框，边界横平竖直
描述一个框需要 4 个像素值：
• 方式1：左上右下边界坐标 𝑙,𝑡, 𝑟, 𝑏
• 方式2：中心坐标和框的长宽 𝑥, 𝑦, 𝑤, ℎ
边界框通常指紧密包围感兴趣物体的框
检测任务要求为图中出现的每个物体预测一个边界框

以下这些概念都指某种框，用在不同的上下文中

区域（Region）：框的同义词
区域提议（Region Proposal，Proposal）：
指算法预测的可能包含物体的框，某种识别能力不强的算法的初步预测结果
感兴趣区域（Region of Interest，RoI）：
当我们谈论需要进一步检测这个框中是否有物体时，通常称框为感兴趣区域
锚框（Anchor Box，Anchor）：
图中预设的一系列基准框，类似滑窗，一些检测算法会基于锚框预测边界框

交并比 ( Intersection Over Union，IOU)

交并比（IoU）定义为两矩形框交集面积与并集面积之比，是矩形框重合程度的衡量指标。

二、评价指标概述

2. TP、FP、TN、FN

2.1 混淆矩阵

提到TP、FP、TN、FN，首先介绍以下混淆矩阵。
混淆矩阵也称误差矩阵，是表示精度评价的一种标准格式，用 $n$ 行 $n$ 列的矩阵形式来表示。
混淆矩阵的每一列代表了预测类别，每一列的总数表示预测为该类别的数据的数目；每一行代表了数据的真实归属类别，每一行的数据总数表示该类别的数据实例的数目。
例如：

表1. 多类别混淆矩阵

</

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。