VOC格式数据集操作类构建-2.统计数据集各类别标签数目和剪裁图像中标注框并保存图片

本博客介绍了如何构建VOC格式数据集操作类,包括统计数据集中各类别标签的数目和根据标注框剪裁图片并保存。首先,通过解析XML文件统计类别出现的次数;然后,利用matplotlib和PIL库进行图像剪裁与保存。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

总目标:建立VOC格式数据集类以及操作内置函数

github项目地址(附有使用说明书):

https://github.com/A-mockingbird/VOCtype-datasetOperation

Day2.统计数据集各类别标签数目和剪裁图像中标注框并保存

1.统计数据集各类别标签数目

使用之前写好的解析代码,对每个xml及xml中每个标注框信息遍历

记录不同类别出现的次数,并保存再字典中

    def _Countobject(self, annofile=None):
        """
        Count the label numbers of every class, and print it
        Precondition: annofile-the direction of xml file
        """
        if annofile == None:
            annofile = self.dataset_anno
        #获取数据集中全部xml文件解析数据
        annoparse = self._ParseAnnos(annofile)
        #建立空字典,用于存储
        count = {}
        #对存储每个xml文件标注信息的字典进行遍历
        for anno in annoparse:
            #对单个xml文件中每个标注框信息进行遍历
     
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值