PASCAL VOC2012是一个集目标分类(Object Classification)、目标检测(Objection Detection)、目标分割(Object Segmentation)和行为识别(Action Classification)的数据集。
PASCAL VOC 2012 数据集官方链接: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC 2012 数据集论文链接 《The PASCALVisual Object Classes Challenge: A Retrospective》: http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf
数据集下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
目录
1. 简介
PASCAL VOC 挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),动作识别(Action Classification)等。
图像分类和检测:
目标分割(语义分割和实例分割):
动作识别:
2. PASCAL VOC 2012 数据集目标类别
PASCAL VOC 2012 数据集共有20种类别,如下表所示:
Vehicles | Household | Animals | Others |
---|---|---|---|
Aeroplane | Bottle | Birds | Persons |
Bicycle | Chair | Cat | |
Boat | Dining table | Cow | |
Bus | Potted plant | Dog | |
Car | Sofa | Horse | |
Motorbike | TV/Monitor | Sheep | |
Train |
3. PASCAL VOC 2012 数据集结构
- Annotations ---------------- 所有的图像标注信息(XML文件)
- ImageSets
- Action ------------------人的行为动作图像信息
- Layout ----------------- 人的各个部位图像信息
- Main --------------------目标检测分类图像信息
- train.txt -----------训练集 5717
- val.txt -------------验证集 5823
- trainval.txt -------训练集+验证集 11540
- Segmentation --------目标分割图像信息
- JPEGImages----------------所有图像文件
- SegmentationClass -------图像分割png图(基于类别)
- SegmentationObject ------图像分割png图(基于目标)
对于目标检测,只关注Main文件里的文件。train.txt 和 val.txt 分别用于训练和验证模型的性能,txt文件里的内容如右边所示,其中数字表示图像的标签及名称。除了完整的训练和验证集,还有不同类别训练和验证集(如dog)。
此外,还将标签(xml文件)的含义进一步阐述
4. 目标检测任务
接下来介绍如何使用数据集中目标检测的数据
- 首先在Main文件中找到train.txt文件,使用代码读取对应的每一行信息,根据每一行信息查询对应的图片文件和标签文件。
- 通过索引在Annotations文件夹下查找对应的标注文件(xml)。如2007_009911,那么在Annotations文件夹中的2007_009911.xml文件如下图所示。
- 接着通过标注文件中的filename查找对应的图片
5. 目标分割任务
后续更新,包括各部分代码