PASCAL VOC 2012数据集

PASCALVOC2012是一个包含20个类别的计算机视觉数据集,用于图像分类、目标检测和分割任务。数据集结构分为Annotations、ImageSets等多个部分,提供训练集和验证集。目标检测涉及Main文件中的train.txt和val.txt,用于训练和评估模型。目标分割任务则关注Segmentation目录下的图像信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PASCAL VOC2012是一个集目标分类(Object Classification)目标检测(Objection Detection)目标分割(Object Segmentation)和行为识别Action Classification)的数据集。

PASCAL VOC 2012 数据集官方链接: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC 2012 数据集论文链接 《The PASCALVisual Object Classes Challenge: A Retrospective》: http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf
数据集下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit

在这里插入图片描述

目录

1. 简介

PASCAL VOC 挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),动作识别(Action Classification)等。

图像分类和检测:
在这里插入图片描述
目标分割(语义分割和实例分割):
在这里插入图片描述
动作识别:
在这里插入图片描述

2. PASCAL VOC 2012 数据集目标类别

PASCAL VOC 2012 数据集共有20种类别,如下表所示:

VehiclesHouseholdAnimalsOthers
AeroplaneBottleBirdsPersons
BicycleChairCat
BoatDining tableCow
BusPotted plantDog
CarSofaHorse
MotorbikeTV/MonitorSheep
Train

3. PASCAL VOC 2012 数据集结构

  • Annotations ---------------- 所有的图像标注信息(XML文件)
  • ImageSets
    • Action ------------------人的行为动作图像信息
    • Layout ----------------- 人的各个部位图像信息
    • Main --------------------目标检测分类图像信息
      • train.txt -----------训练集 5717
      • val.txt -------------验证集 5823
      • trainval.txt -------训练集+验证集 11540
    • Segmentation --------目标分割图像信息
  • JPEGImages----------------所有图像文件
  • SegmentationClass -------图像分割png图(基于类别)
  • SegmentationObject ------图像分割png图(基于目标)

对于目标检测,只关注Main文件里的文件。train.txt 和 val.txt 分别用于训练和验证模型的性能,txt文件里的内容如右边所示,其中数字表示图像的标签及名称。除了完整的训练和验证集,还有不同类别训练和验证集(如dog)。

在这里插入图片描述

此外,还将标签(xml文件)的含义进一步阐述

在这里插入图片描述

4. 目标检测任务

接下来介绍如何使用数据集中目标检测的数据

  • 首先在Main文件中找到train.txt文件,使用代码读取对应的每一行信息,根据每一行信息查询对应的图片文件和标签文件。
  • 通过索引在Annotations文件夹下查找对应的标注文件(xml)。如2007_009911,那么在Annotations文件夹中的2007_009911.xml文件如下图所示。
    在这里插入图片描述
  • 接着通过标注文件中的filename查找对应的图片

在这里插入图片描述

5. 目标分割任务

后续更新,包括各部分代码

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值