YOLOv1 数据集加载

本文详细介绍了PASCALVOC2007数据集的结构,包括其20个类别和文件组织,展示了如何使用Python和TensorFlow进行数据加载和XML解析,为YOLOv1模型的训练提供基础。

相关文章

项目地址:YOLOv1 VOC 2007

笔者训练的权重地址:阿里云盘分享

10 秒文章速览

本文针对讲解 PASCAL VOC 2007 数据集的结构、信息进行了粗略说明,并演示了数据集加载

PASCAL VOC 项目传送门:The PASCAL Visual Object Classes Homepage

这里,笔者也给出自己整理的 PASCAL VOC 2007 数据集的下载地址:Kaggle-PASCAL VOC 2007

本文讲的数据集针对 PASCAL VOC 2007

数据集介绍

数据集是从现实场景中采集的图片,一共包含20个类别

  • 人:人🧔
  • 动物:鸟🦜、猫🐈、牛🐄、狗🐕、马🐎、羊🐏
  • 车辆:飞机✈️、自行车🚲、船🚢、公共汽车🚌、汽车🚗、摩托车🏍️、火车🚂
  • 室内:瓶子🍾、椅子🪑、餐桌、盆栽🪴、沙发🛋️、电视/显示器📺

数据集可以用于主要可以用于检测、分割这2项任务

目标检测
1.png
2.png

目标分割
3.png

数据集文件结构

PASCAL VOC 2007 的训练、验证集文件结构如下

  • VOC 2007
    • Annotations:放置每张图片的标注,储存为XML格式
    • ImageSets
      • Layout:train.txt 训练集、val.txt 验证集、trainval.txt 训练验证汇总集
      • Main:对各个类别的训练集、验证集分开放置
      • Segmentation:放置用于分割任务的数据集
    • JPEGImages:放置所有图片
    • SegmentationClass:按类别进行图像分割,同一类别的物体会被标注为相同颜色
    • SegmentationObject:按对象进行图像分割,即使是同一类别也会被标注为不同颜色

XML 文件

xml文件的内容如下,标注了一张图片中目标的边框、类别等信息

<annotation>
    <folder>VOC2007</folder>
    <filename>000005.jpg</filename>
    <source>
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
        <flickrid>325991873</flickrid>
    </source>
    <owner>
        <flickrid>archintent louisville</flickrid>
        <name>?</name>
    </owner>
    <size>
        <width>500</width>
        <height>375</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>chair</name>
        <pose>Rear</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>263<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

余将董道而不豫兮

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值