"""
使用说明:
1、在两个path路径下填入地址,!!xml、jpg是两个独立的文件夹!!
2、筛查出多余的xml并提示少xml,不删除。 用作剔除之后的检查工作
"""
import os
path1 = r'D:\Desktop\xin_all1239\jpg' # 图片的地址
path2 = r'D:\Desktop\xin_all1239\xml' # 对应标签的地址
def file_name(image_dir,xml_dir):
jpg_list = []
xml_list = []
for root, dirs, files in os.walk(image_dir): # 遍历Iamges 文件夹
for file in files:
jpg_list.append(os.path.splitext(file)[0]) # 将文件的名字剔除.jpg后添加在jpg_list[]的列表中
print(jpg_list) #显示全部Images文件名,在一个列表下
for root, dirs, files in os.walk(xml_dir):
for file in files:
xml_list.append(os.path.splitext(file)[0])
print(xml_list) #显示全部label文件名,在一个列表下
print(len(jpg_list) ) # 显示有多少张图片
print("jpg" )
print(len(xml_list) ) # 显示有多少张标签
print("xml" )
#筛查出多余的xml并提示,不删除
diff = set(xml_list).difference(set(jpg_list)) # 差集,在a中但不在b中的元素
for name in diff:
print("no xml", name + ".xml")
if __name__ == '__main__':
file_name(path1,path2)
筛查多余的xml文件,不删除。
最新推荐文章于 2024-06-19 09:43:34 发布