分类数据集列表生成代码

最新推荐文章于 2024-11-08 10:07:22 发布

原创最新推荐文章于 2024-11-08 10:07:22 发布 · 354 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

计算机视觉专栏收录该内容

14 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

直接运行就可以，项目链接：（待更新）

import codecs  
import os  
import random  
import shutil  
from PIL import Image  
  
# 训练和验证数据集的比例，多少比例用于训练
train_ratio = 4.0 / 5
  
all_file_dir = 'imgdata/IDcard'  
class_list = [c for c in os.listdir(all_file_dir) if os.path.isdir(os.path.join(all_file_dir, c)) and not c.endswith('Set') and not c.startswith('.')]  
class_list.sort()
print(class_list)  
train_image_dir = os.path.join(all_file_dir, "trainImageSet")  # 这里生成trainImageSet/ 文件，训练集图片都保存在该文件夹下（不论是哪个分类）。
if not os.path.exists(train_image_dir):  
    os.makedirs(train_image_dir)  
      
eval_image_dir = os.path.join(all_file_dir, "evalImageSet")  
if not os.path.exists(eval_image_dir):  
    os.makedirs(eval_image_dir)  
  
train_file = codecs.open(os.path.join(all_file_dir, "train.txt"), 'w')  
eval_file = codecs.open(os.path.join(all_file_dir, "eval.txt"), 'w')  
  
with codecs.open(os.path.join(all_file_dir, "label_list.txt"), "w") as label_list:  
    label_id = 0  
    for class_dir in class_list:  
        # label_list.write("{0}\t{1}\n".format(label_id, class_dir))  # \t在这里表示tab键而不是空格，所有下一行替换成空格。
        label_list.write("{0} {1}\n".format(label_id, class_dir))
        image_path_pre = os.path.join(all_file_dir, class_dir)  
        for file in os.listdir(image_path_pre):  
            try:  
                img = Image.open(os.path.join(image_path_pre, file))  
                if random.uniform(0, 1) <= train_ratio:  
                    shutil.copyfile(os.path.join(image_path_pre, file), os.path.join(train_image_dir, file))  
                    train_file.write("{0} {1}\n".format(os.path.join(train_image_dir, file), label_id))  
                else:  
                    shutil.copyfile(os.path.join(image_path_pre, file), os.path.join(eval_image_dir, file))  
                    eval_file.write("{0} {1}\n".format(os.path.join(eval_image_dir, file), label_id))  
            except Exception as e:  
                pass  
                # 存在一些文件打不开，此处需要稍作清洗  
        label_id += 1  
              
train_file.close()  
eval_file.close()