一、目标检测:识别图片中有哪些物体并且找到物体的存在位置,多任务旨在从图像或视频中找出感兴趣的目标(如人、动物、车辆等)的位置,并确定其类别。位置信息通常用边界框(bounding box)来表示,即包含目标的最小矩形区域,一般由左上角坐标和右下角坐标或者中心坐标以及宽和高来确定。可能存在目标种类与数量繁多,目标尺度不均,遮挡、噪声等外部环境。
二、应用场景:1、在安防监控领域,可以检测监控画面中的可疑人物、车辆等目标,及时发现异常行为。2、在自动驾驶中,检测道路上的行人、其他车辆、交通标志等目标,为车辆的行驶决策提供依据。3、在工业生产中,检测产品表面的缺陷或者识别生产线上的零部件种类和位置。
三、目标检测的数据集
1、VOC数据集:PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。
Ø
4
大类,
20
小类
Ø
VOC 2007
:
9963
图片
/24640
目标
Ø
VOC 2012
:
23080
图片
/54900
目标
2、COCO