图像分析学习笔记(5):智能目标检测与识别
目标检测与识别的概念
- 计算机视觉的四大基础任务:图像分类、目标定位、目标检测、语义分割
- 图片分类:
通过算法对其中的对象进行分类。 - 目标检测:
在图像中找到特定类别的位置,并用边框把目标圈起来。
目标检测=定位+分类- 传统目标检测流程:区域选择-特征提取-分类器分类
- 目标检测的挑战:目标在尺度、光照、姿态、遮挡方面差异很大
目标检测与识别的评价指标
- 目标检测算法的输出:类别置信度、边界框(预测框)
- 度量:交并比、正确类别置信度,两个框的交集比上两个框的并集
- 精准率和召回率
- Average Precision:不同Recall下的Precision平均
- mAP:不同类别的AP平均
基于深度学习的目标检测与识别
- 数据
- 准备训练数据:图像和标签 jpg和xml
- 结构
- 非极大值抑制:选择最大置信度的box,剔除与该box iou过大的box
- 两阶段目标检测:候选区域生成、分类
- R-CNN:区域推荐、CNN分类
- Fast R-CNN:roipooling(依次前向传播得到所有候选区域)、多任务损失函数(分类和回归同时考虑)
- Faster R-CNN:使用区域推荐网络替代选择性的搜索=RPN+Fast R-CNN
- 单阶段目标检测:
- YOLO:YOU ONLY LOOK ONCE.不足:定位精度差、漏检高
- SSD:SINGLE SHOT MULTIBOX DETECTOR,加入特征金字塔
- YOLOV2:anchor策略
- YOLOV3:使用Darknet-53网络、多尺度预测
- YOLOV~