Caltech行人数据集转化VOC数据集

本文档详细介绍了如何将Caltech Pedestrian数据集转换为PASCAL VOC格式,包括Seq文件转JPEG图像、VBB标注转XML、整理文件夹结构、重命名文件、生成TXT文件指定数据集划分以及处理标注标签错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CaltechPestrian2VOC

代码仓库地址

1. Seq文件转化成JEPG图像文件

调用seq2jpg.py文件,输入data文件夹,输出到JPEG文件夹中,解析后的图片会是

2. VBB标注文件转化为XML文件

调用vbb2voc.py文件,输入annotations文件夹,输出到xmlresult文件夹中。

3.将所有的xml文件一集JPEG文件分别放到两个统一的文件夹里

调用mergeimg.py和mergexml.py文件。

4.重命名图片和XML文件

按照“xxxxxx”这样的6位数字索引命名JPEG图片文件以及对应的XML文件。

5.生成4个txt文件指定训练集、验证集、数据集、训练验证集

调用generateTXT.py文件,输入xmlresult文件夹,输出到ImageSets/Main文件夹中。

6. 替换标签(辅助)

Caltech的标注里有很多别的类别的行人,people,person,findPeople.py是将people标签替换成person。这是一个辅助文件,不是必须用到的。

IMPORTANT NOTES
I found there’re some errors in the vbb files. To be specific, some bounding boxes are out of the image such as the xmax is gr

评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值