目标检测任务数据集介绍-PASCAL VOC数据集

本文介绍了目标检测数据集PASCAL VOC,包括数据集的简介、下载方式和主要内容。PASCAL VOC提供了20个类别的目标识别标准数据集,尽管比赛已结束,但因其小巧和方便,仍常用于算法开发和复现。数据集包含四个任务:分类、检测、分割和人体部位识别。主要关注点在于Annotations中的XML标注文件,ImageSets中的txt文件和JPEGImages中的图片。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在做目标检测的相关工作,整理了一下目标检测的数据集,本文就简要介绍目标检测PASCAL VOC数据集,PASCAL VOC比赛在2012年之后已经不再举行了,MS COCO的数据在应用上也替代了VOC数据,不过由于数据量不是很大(VOC2007的数据全部压缩包下载总共869MB,同时也发布了test集的标注数据),在做算法demo或者复现别人算法的时候,使用还是很方便的。

简介

官网地址:http://host.robots.ox.ac.uk/pascal/VOC/
首先,不管想了解什么数据集或是算法,第一个要找的就是官方的/原作者发布的链接。
在这里插入图片描述
进入官网,PASCAL VOC的全称为Pattern Analysis, Statistical Modelling and Computational Learning Visual Object Classes。也就是一个目标分类任务。
PASCAL VOC任务做了以下几件事:

  1. 提供了一个用于目标类型识别的标准数据集
  2. 提供了一个使用该数据集以及标注数据的通用工具
  3. 评价不同算法提交的结果的精度
  4. 05-12年运营了一个目标识别比赛

目前比赛已经不再进行,但是结果评价服务器仍然可以使用。详实的介绍可以阅读官方文档everingham10everingham15。分别是10年和15年介绍该项目的官方论文。
VOC比赛数据集也不是一成不变的,随着比赛一直在发展变化,下表简介了VOC数据发展的主要概况。

年份 统计信息 新发展变化 注意
2005 只有四类:自行车、汽车、摩托车、人;训练/验证/测试数据:1578张影像 两个任务:分类和目标检测 数据从现有公开数据得到,内容没有flickr影像丰富,目前该数据集已弃用
2006 10类目标;训练/验证/测试数据:共2618张图片;包含4754个标注目标 数据来自flickr与MSRC数据集 MSRC的数据内容比flickr的单调,目前该数据集也已弃用
2007 20类目标(在后文详细介绍);训练/验证/测试数据:共9963张图片,包含24640个标注目标 数据类别数量从10增长到20;引入了分割任务、人体部位检测的taster任务;标注数据中加入了Truncation(截断)标签;分类任务的精度评价改成了Average Precison,以前是ROC-AUC 确定了20个类别,以后的数据集都固定为20个类别;这是最后一年公开teset数据标注数据的比赛
2008 20个类别;训练/验证数据与测试数据的比例依旧划分为1:1;训练/测试数据含有4340张图片,包含10363个标注对象 加入了Occlusion标签;test测试数据不再公开;分割和人体部位检测数据集影像包含相应的VOC2007中的图片
2009 20个类别;训练/验证数据集共有7054张图片,包含
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

伙伴lqs

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值