目标检测神经网络
概念
模型分类有三种:图像分类即输出图像类别和概率;单目标检测,输出目标的概率和位置;多目标检测,同时输出多个目标的分类、位置、概率。
位置检测分为两种形式:一种是矩形框;另一种是关键点。
交并比,Intersection Over Union,模型推理的矩形框与真值矩形框的重叠度,用于判断结果精度。
非极大值抑制:从同一目标上的多个矩形框筛选最好的一个。
算法流程:
- 剔除概率小于阈值的框
- 从剩余的框中选择概率最大的
- 剔除与前框IOU大于阈值的框,重复步骤2,直到唯一
NMS iteratively removes lower scoring boxes which have an IoU greater than iou_threshold with another (higher scoring) box.
典型方法介绍
从流程上可分为一步、两步检测方法两大类,前者以YOLO系列等模型为代表,后者即RCNN系列,YOLO的主要流程:
- 将图像划分GxG个网格
- 对每一个网格图像做CNN预测
- 对重叠的框运行NMS
本篇主要介绍RCNN系列。
Region-based CNN系列
RCNN系列是典型的两步检测:先找ROI,再对ROI识别。
用颜色、纹理(灰度)直方图判断两个候选区域是否相近。
图像尺度是有限的,所以