python 比较两个文件夹中的文件名（Annotation标注完全检查）

查找并列出标注缺失的图片文件

最新推荐文章于 2023-08-24 09:16:58 发布

原创最新推荐文章于 2023-08-24 09:16:58 发布 · 548 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

该代码段用于比较Annotations和Object_split两个文件夹中的XML和JPEG文件，找出那些在其中一个文件夹中有而另一个文件夹中没有的文件。它利用Python的set操作和os库来检查文件名的差异，特别是关注那些XML标注文件可能缺失的情况。

原因

Annotations和JPEGS的文件夹，有部分图片的标注缺失。

代码

import os
def compare_folders(folder1, folder2):
    # files1 = set(os.listdir(folder1))
    # files2 = set(os.listdir(folder2))

    files1 = set(os.path.splitext(file)[0] for file in os.listdir(folder1))
    files2 = set(os.path.splitext(file)[0] for file in os.listdir(folder2))
    unique_files = files1.symmetric_difference(files2)

    return unique_files


folder1 = './Annotations'
folder2 = './Object_split'

unique_files = compare_folders(folder1, folder2)

def get_files_with_extension(folder, extension):
    files = []
    for file in os.listdir(folder):
        if file.endswith(extension):
            files.append(file)
    return files
print(len(unique_files))
# for file in unique_files:
#     print(file)


for file in get_files_with_extension(folder1, ".xml"):
    if os.path.splitext(file)[0] in unique_files:
        print(file)

for file in get_files_with_extension(folder2, ".jpg"):
    if os.path.splitext(file)[0] in unique_files:
        print(file)