目标检测项目

· 识别图片中有哪些物体并且找到物体的存在位置。

 · 多任务:位置 + 类别

· 目标种类与数量繁多的问题

· 目标尺度不均的问题

· 遮挡、噪声等外部环境干扰

目标检测的数据集

· VOC 数据集:PASCAL VOC 挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。

 · 4 大类,20 小类
· VOC 2007:9963 图片
/24640 目标
· VOC 2012:23080 图片
/54900 目标

· COCO 数据集:起源于微软 2014 年出资标注的 MS COCO 数据库。

 · 包含 20 万个图像
· 80 个类别
· 超过 50 万个目标标注
· 平均每个图像的目标数是 7.2

目标检测的 Ground Truth

 · 类别+真实边界框坐标(x,y,w,h)

· 假设左图尺寸为 1000*800px

 · YOLO(TXT)格式:
(x,y,w,h)分别代表中心点坐标和宽、高
x,y,w,h 均为归一化结果

· VOC(XML)格式:
(Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。

· COCO(JSON)格式:
(Xmin, Ymin, W, H),其中 x,y,w,h 均不是归一化后的数值,分别代表左上角坐标和宽、高

 

目标检测的评估指标

· IoU:Intersection over Union

 · 检测结果的类别

 

 · Precision:准确率,查准率
· Recall:召回率,查全率
· mean AP:每个类别所得到的 AP 的均值
· Average Precision:11 点法、近似面积法

 · mean 与 average

· mean:算数平均

· average:包含其他的度量指标

· Average P:P 值需要设计度量规则让它均衡

· mean AP:AP 够均衡了,直接 mean 即可

 · AP 计算方法:11 点法
AP = 1 / 11 ∑_{r = 0, 0.1, ..., 0.9, 1} p_{0.1*r}(r)
r = [0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1]
p = [0.9, 0.666, 0.4285, 0.4285, 0.4285, 0, 0, 0, 0, 0, 0]
AP = 1 / 11 * (1 + 0.666 + 0.4285 + 3 * 0) = 26.4%

 

目标检测的传统方法

· 滑动窗口法
· 需要人工设计尺寸

·大量冗余操作
· 定位不准确

 目标检测的深度学习方法

 anchor - base 和 anchor - free

anchor - base
√ anchor - base是自顶向下的
√ 类似于传统方法,滑动窗口
法穷举出许多,然后再根据
置信度之类的进行筛选
anchor - free
√ anchor - free是自底向上的
√ 想办法自动生成,不穷举
√ free掉了anchor的预设过程

· two stage 算法流程

· one stage 算法流程

 

 目标检测的深度学习方法
· 常见two stage算法
 
- 经典发展线:R - CNN、SPP - Net、Fast R - CNN、 Faster R - CNN
 
- 其他:Cascade R - CNN、Guided Anchoring
 
· 常见one stage算法
 
- YOLO系列:YOLO v1 - v5
 
- SSD系列:SSD、DSSD、FSSD
 
- 其他经典:RefineDet

· 非极大值抑制(Non - maximum suppression,NMS)
 
设定目标框的置信度阈值,常用
的阈值是0.5左右
根据置信度降序排列候选框列表
选取置信度最高的框A添到输出列
表,将其从候选框列表删除
候选框列表中的所有框依次与A计
算IoU,删除大于阈值的候选框
重复上述过程,直到候选框列表
为空,返回输出列表

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值