1.总体结构

Annotations——所有图像标注信息,XML格式
ImageSets——图像信息
Action——人的行为动作图像信息
Layout——人的各个部位图像信息
Main——目标检测分类图像信息
train.txt——训练集5717
val.txt——验证集5823
JPEGImage——图片png格式
trainval.txt——训练集+验证集11540
Segmentation——目标分割图像信息
SegmentationClass——图像分割png图(基于类别)
SegmentationObject——图像分割png图(基于坐标)
2.Annotations中文件——以一个xml文件2007_000027.xml为例,以此类推。
<annotation>
<folder>VOC2012</folder>
<filename>2007_000027.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>486</width>
<height>500</height>
<depth>3<

本文详细介绍了PASCAL VOC数据集的结构,包括Annotations中的XML信息,如图像尺寸、边界框和对象标注,以及train.txt、val.txt和trainval.txt等文件的作用。此外,还探讨了Main目录下的文件格式,用于目标检测和分类任务。
最低0.47元/天 解锁文章
976

被折叠的 条评论
为什么被折叠?



