将xml中的中文标签转为英文

该博客使用Python的ElementTree库解析XML文件,从VOC2007数据集中提取图像对象的名称和边界框信息。博客内容涉及图像识别和数据标注,将对象名称转换为拼音并写入文本文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

别问,就是写着玩

from pypinyin import lazy_pinyin

for image_id in image_ids:
    with open("./input/ground-truth/"+image_id+".txt", "a", encoding='utf8') as new_f:
        root = ET.parse("/home/yons/data/huawei/shenzhen/trainval/VOC2007/Annotations/"+image_id+".xml").getroot()
        for obj in root.findall('object'):
            obj_name = obj.find('name').text
            obj_name = '_'.join(lazy_pinyin(obj_name))
            bndbox = obj.find('bndbox')
            left = bndbox.find('xmin').text
            top = bndbox.find('ymin').text
            right = bndbox.find('xmax').text
            bottom = bndbox.find('ymax').text
            new_f.write("%s %s %s %s %s\n" % (obj_name, left, top, right, bottom))
print("Conversion completed!")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值