目标检测ObjectDetection
概述
目标检测的目的主要是通过模型检测出目标+类别
主流的目标检测以矩阵框形式输出,更高精度的是语义分割任务(对网络模型的要求更高)
数据集
数据集的标注与网络的输出强相关,下面介绍两种常用的数据集。
voc数据集
官方网站:The PASCAL Visual Object Classes Homepage (ox.ac.uk)
数据集原图片见下
(常用的是2007、2012数据集)
下面是2007数据集的文件目录:
依次为:
- Annotations数据集标注,包含XML文件,描述图片的各种信息(目标的位置坐标等)
- ImageSets图片集合,主要关注main文件夹,里面的文件包含不同类别目标的训练数据集图片名称
- JPEGImages原图片
- SegmentationClass标注(同类别)
- SegmentationObject标注(单个物体)
举例:000019.jpg
原图像见下:
标注内容:
<annotation>
<folder>VOC2007</folder>
<filename>000019.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
<flickrid>330638158</flickrid>
</source>
<owner>
<flickrid>Rosenberg1/ Simmo</flickrid>
<name>?