统计数据集中真实标记框的分布情况

本文探讨了目标检测数据集中,经过等比例或固定尺寸缩放后的ground truth box分布情况。统计这些分布对于网络优化至关重要,例如,可以依据分布特点进行模型裁剪,删除针对特定大小box不敏感的网络层。提供的代码示例展示了如何在缩放为300*300的图片上统计box的宽高分布和面积占比,以辅助理解数据特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目标检测的数据集中的ground truth box的分布情况很重要。

一般原始图片在送入网络前会进行缩放(等比例缩放,固定尺寸缩放等),则我们使用lableImg等标记工具打的标签框对应的区域的大小也会缩放。统计其数据分布情况,可以为网络优化提供参考(比如说,如果缩放后,都分布于特别大的范围或者特别小的范围,那么就将网络中检测其他范围大小的层数删除,进行模型的裁剪)

下面的实例代码,是将图片固定尺寸缩放到300*300,然后统计缩放后的图片上box的width,height数值分布(以5为划分,则300可以分为60份),统计缩放后box面积的分布(按比例统计分布,即计算新的面积占300*300的百分比,同样每5%进行划分),代码仅供参考,按自己的需要进行修改即可。

'''
统计图片缩放后ground truth box的分布情况
必须提供:
	xml_file_path
	new_image_size
可选:
	flag,默认为Fales,当改为True时,必须提供:
				new_xml_file_save_path
				image_file_path
				new_image_file_save_path
'''
import os
import cv2
from xml.etree import ElementTree as ET

xml_file_path='all_xml'
new_xml_file_save_path='xml_results'
image_file_path='all_image'
new_image_file_save_path='image_results'
new_image_size=(300,300)
flag=False                 #是否需要得到缩放后新的xml与image

def open_xml(xml_name):
	'''
	打开xml文件
	:param xml_path:
	:return:
	'''
	xml_path = os.pa
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值