【Python3】取两个文件夹下不重复的交集string文件名

在计算机视觉目标检测场景下,做图像增加需对图片批量操作,要获取图片和对应标注文件路径。因前期数据收集问题,需找出image和xml文件前缀交集。采用dict处理,后续用list遍历实现文件一一对应操作。

前提场景

在这里插入图片描述
在计算机视觉的场景下,如果是目标检测,肯定是需要 图片文件和对应的目标检测的标注文件,如果是VOC格式那就是xml文件,但是出现的问题就是我目前想做图像增加,需要对图片进行对应的批量的旋转等操作,所以需要得到目前这些文件的路径才能进行修改,但是因为前期收集数据的时候会出现有的图片本来就没有目标物体所以不存在xml文件,有的是存在xml文件,但是命名不小心更改了,这里需要操作只找文件image和xml的文件前缀的交集
即 . 之前的string name的交集,图中就是 che, hongshu两个.

解决代码

其实有很多种解决方式,比如直接遍历等等,但是那样的效率太低了,这里采用dict来处理。
代码如下:

import os
image_path = './input/image'
xml_path = './input/xml'

image_list = os.listdir(image_path)
xml_list = os.listdir(xml_path)

image_name_path = dict([])
for image in image_list:
    if image_name_path.get(image.split('.')[0], None) == None:
        image_name_path[image.split('.')[0]] = 1

for xml in xml_list:
    if image_name_path.get(xml.split('.')[0], None) == 1:
        image_name_path[xml.split('.')[0]] = 0

image_name_path_list = []
for key, value in image_name_path.items():
    if value == 0:
        image_name_path_list.append(key)

print(image_name_path_list)

结果如下:
在这里插入图片描述

接下来运用list进行遍历即可每个image和xml文件都能一一对应的操作,属于string的交集操作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值