Pascal Voc格式转ICDAR2015格式的脚本

本文提供了一段Python脚本,用于将PascalVoc格式的数据转换为ICDAR2015格式,适用于OCR项目中数据集格式的转换需求。脚本遍历XML文件,读取边界框坐标并将其写入文本文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近做OCR的项目,需要将Pascal Voc的格式转换为ICDAR2015的格式,所以写了这个转换脚本。

 

import os
import xml.etree.ElementTree as ET

xmldir='Annotations'
gtdir='ICDAR_gt'

if not os.path.exists(gtdir):
    os.mkdir(gtdir)

xmlfiles=os.listdir(xmldir)
for xmlfile in xmlfiles:
    tree = ET.parse(xmldir+'/'+xmlfile)
    root = tree.getroot()
    gt_name='gt_'+xmlfile.split('.')[0]+'.txt'
    with open(gtdir+'/'+gt_name,'a') as f:
        for obj in root.iter('object'):
            difficult = obj.find('difficult').text
            number = obj.find('name').text
            xmlbox = obj.find('bndbox')
            xmin=int(xmlbox.find('xmin').text)
            xmax=int(xmlbox.find('xmax').text)
            ymin=int(xmlbox.find('ymin').text)
            ymax=int(xmlbox.find('ymax').text)
            print('xmin:',xmin)
            print('xmax:',xmax)
            print('ymin:',ymin)
            print('ymax:',ymax)
            x1=xmin
            y1=ymin
            x2=xmax
            y2=ymin
            x3=xmax
            y3=ymax
            x4=xmin
            y4=ymax
            line=str(x1)+','+str(y1)+','+str(x2)+','+str(y2)+','+str(x3)+','+str(y3)+','+str(x4)+','+str(y4)+','+number+'\n'
            f.write(line)




 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值