相关文章
项目地址:YOLOv1 VOC 2007
笔者训练的权重地址:阿里云盘分享
10 秒文章速览
本文针对讲解 PASCAL VOC 2007 数据集的结构、信息进行了粗略说明,并演示了数据集加载
PASCAL VOC 项目传送门:The PASCAL Visual Object Classes Homepage
这里,笔者也给出自己整理的 PASCAL VOC 2007 数据集的下载地址:Kaggle-PASCAL VOC 2007
本文讲的数据集针对 PASCAL VOC 2007
数据集介绍
数据集是从现实场景中采集的图片,一共包含20个类别
- 人:人🧔
- 动物:鸟🦜、猫🐈、牛🐄、狗🐕、马🐎、羊🐏
- 车辆:飞机✈️、自行车🚲、船🚢、公共汽车🚌、汽车🚗、摩托车🏍️、火车🚂
- 室内:瓶子🍾、椅子🪑、餐桌、盆栽🪴、沙发🛋️、电视/显示器📺
数据集可以用于主要可以用于检测、分割这2项任务
目标检测


目标分割

数据集文件结构
PASCAL VOC 2007 的训练、验证集文件结构如下
- VOC 2007
- Annotations:放置每张图片的标注,储存为XML格式
- ImageSets
- Layout:train.txt 训练集、val.txt 验证集、trainval.txt 训练验证汇总集
- Main:对各个类别的训练集、验证集分开放置
- Segmentation:放置用于分割任务的数据集
- JPEGImages:放置所有图片
- SegmentationClass:按类别进行图像分割,同一类别的物体会被标注为相同颜色
- SegmentationObject:按对象进行图像分割,即使是同一类别也会被标注为不同颜色
XML 文件
xml文件的内容如下,标注了一张图片中目标的边框、类别等信息
<annotation>
<folder>VOC2007</folder>
<filename>000005.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
<flickrid>325991873</flickrid>
</source>
<owner>
<flickrid>archintent louisville</flickrid>
<name>?</name>
</owner>
<size>
<width>500</width>
<height>375</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>chair</name>
<pose>Rear</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>263<

本文详细介绍了PASCALVOC2007数据集的结构,包括其20个类别和文件组织,展示了如何使用Python和TensorFlow进行数据加载和XML解析,为YOLOv1模型的训练提供基础。
最低0.47元/天 解锁文章
3825

被折叠的 条评论
为什么被折叠?



