CrowdHuman数据集格式 ——odgt文件格式

本文介绍了CrowdHuman数据集中的odgt标注文件格式,包括demo和原标注文件的区别,如width、height键与head_attr键的差异,并指出在转换为COCO格式时遇到的问题。同时,提到了标注文件中的ignore字段在不同tag下的位置。博主计划在后续博客中分享将CrowdHuman标注转为COCO格式的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

注:之前说要将Crowd Human数据集标注转换成COCO数据集标注格式,现在先来看一下odgt文件里的数据是怎么样保存的。

demo下的odgt标注文件

在Crowd Human数据集目录下,还有一个demo文件夹。这个demo是干么的呢,博主查了一下说是提取odgt里面的数据的?所以就先看里面的代码和odgt文件
在这里插入图片描述
data下面有一个get_human.odgt,大小才66k,方便打开。(原标注文件的val23M,train80M,这么大的文件在电脑或服务器中打开,要卡好久…)。而demo.py文件涉及到线程等一大堆难懂的东西,博主直接放弃,直接看odgt文件了。

先说一下坑吧,这个odgt里面的键值和原标注文件odgt里的键值不是对应的。最明显的区别:demo下的odgt有width、height这两个key,没有head_attr这个键值。但是,在原标注文件odgt里面没有这两个键值width、height有head_attr

所以博主根据demo里面的odgt写了crowdhuman转到coco标注格式的函数后,兴致勃勃的去跑原crowdhuman的标注文件,然后就直接出现了如下的error。一脸懵逼,这格式居然不是一致的。
在这里插入图片描述

打开了annotation_val.odgt文件,比对了一下,发现里面格式并不是一致的。不过,看完get_human.odgt这个文件,理解了大概是怎么放数据的,再去看annotation_val.odgt就能快速看懂数据的存放,只不过有些键值没有而已,不影响理解。

下面的代码是get_human.odgt文件中的一行数据

{
   
   "fpath": "",  #字典
"gtboxes": [   #gtboxes里面是个列表

	{
   
   
	"tag": "person",  #标签
	"extra": {
   
           #下面这几个数博主不清楚,有知道的大佬,还望告知一下。
		"occ": 0, 
		"vbox_id": 0, 
		"box_id": 0}, 
	"vbox": [[67, 60, 333, 740]], # 检测框可视框
	"box": [67, 60, 333, 740], # 读取人头检测框?
	"fbox": [67, 60, 333, 810] #检测框全身框
	}, 

	{
   
   
	"tag": "person", 
	
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值