利用python划分训练集和测试集方法如下
from sklearn.model_selection import train_test_split
from PIL import Image
import os
path="./path/your_datasets" #你要划分的数据集
dat= os.listdir(path)
train, test = train_test_split(dat, test_size = 0.2)#0.2表示需要划分的测试集比例
for file in train:
im2 = Image.open("./path/your_datasets"+file)
im2.save("./path/train/"+file)#划分后的训练集存放位置
for file in test:
im2 = Image.open("./path/your_datasets"+file)
im2.save("./path/test/"+file)#划分后的训练集存放位置根据注释改成自己的路径,运行结束就可以得到自己随机划分的训练集和测试集了。
使用Python的sklearn进行数据集划分,
该文介绍了如何利用Python中的sklearn.model_selection库的train_test_split函数,结合PIL库处理图像数据,将数据集划分为训练集和测试集。通过指定测试集的比例(如0.2),可以随机划分数据,并将结果分别保存到对应的文件夹中。
1501





