文章目录
数据集准备
数据集形式
初学图像分类任务时往往会用MNIST或者CIFAR-10作为实验练手项目,但这两个数据集是各大框架内部已经集成的,导入的时候只需要直接调用即可。
当使用自己的数据集时要先做一些处理。
这次的图像分类任务数据集形式如下:
共有11个文件夹,前10个是类别及其对应的图片,第11是测试(预测)图片,分类任务的成绩由Testset文件夹的准确度给定。
数据集处理
在网上查阅相关资料后,把文件夹分为如下形式:
TL_Dataset中存放训练集:
由于最后两类都是Negative类,故统一成一类,变为9分类任务
合并时文件统一重新命名
由于要把最后两类合并成一类,而在每一类文件夹中。图片都是从0开始命名,因此要把第10类的文件从5001(第9类标号到5000)开始重命名。
- 文件批量重命名
import os
class BatchRename():
#批量重命名文件夹中的图片文件
def __init__(self):
self.path = r'C:\Users\yzh_1\Desktop\assignment2\TL_Dataset\TL_Dataset\9'
def rename(self):
filelist = os.listdir(self.path