图像分类任务1——读取自己的数据集

本文介绍如何处理和读取自定义的图像分类数据集,数据集包含11个文件夹,其中10个是训练类别,最后一个用于测试。在处理中,将最后两类合并为一类,变成9分类任务,并对文件进行统一重命名。在读取数据集时,通过load_data函数将图像和标签分别存入列表,注意训练集的顺序可以打乱,而测试集需要保持原有顺序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据集准备

数据集形式

初学图像分类任务时往往会用MNIST或者CIFAR-10作为实验练手项目,但这两个数据集是各大框架内部已经集成的,导入的时候只需要直接调用即可。
当使用自己的数据集时要先做一些处理。
这次的图像分类任务数据集形式如下:
在这里插入图片描述
共有11个文件夹,前10个是类别及其对应的图片,第11是测试(预测)图片,分类任务的成绩由Testset文件夹的准确度给定。

在这里插入图片描述

数据集处理

在网上查阅相关资料后,把文件夹分为如下形式:
在这里插入图片描述
TL_Dataset中存放训练集:
在这里插入图片描述

由于最后两类都是Negative类,故统一成一类,变为9分类任务
在这里插入图片描述

合并时文件统一重新命名

由于要把最后两类合并成一类,而在每一类文件夹中。图片都是从0开始命名,因此要把第10类的文件从5001(第9类标号到5000)开始重命名。

  • 文件批量重命名
import os
class BatchRename():
    #批量重命名文件夹中的图片文件
    def __init__(self):
        self.path = r'C:\Users\yzh_1\Desktop\assignment2\TL_Dataset\TL_Dataset\9'
     def rename(self):
        filelist = os.listdir(self.path
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值