数据集按3:7分成测试集和训练集(python)

数据集按3:7分成测试集和训练集(python)


  • 文件放置位置如下:
  • 这里写图片描述

  • cat文件夹下图片名称为:(共有38张图片)

  • 这里写图片描述

    代码:

import numpy as np
import os, sys
import os.path
from PIL import Image
url = 'G:/data_image/cat/'#图片存储的文件夹名称
classname = 'cat.'#图片的名字中字符部分
n=38#图片的数量
array = np.arange(n)#产生长度为n的序列
np.random.shuffle(array)#将arrray序列随机排列
#把path文件夹下以及其子文件下的所有.jpg图片移动到new_path文件夹下
def moveImg(path,new_path):
    img=Image.open(path)
    img.save(os.path.join(new_path,os.path.basename(path)))
#30%的数据生成验证集
new_path='G:/data_image/val/'
i=0
while(i <= (int(n*0.3))):
    DatasetPath = url + classname + str(array[i]) + '.jpg' 
    moveImg(DatasetPath,new_path)
    i=i+1
#70%的数据生成训练集
new_path='G:/data_image/train/'
while(i <= (n-1)):
    DatasetPath = url + classname + str(array[i]) + '.jpg'
    moveImg(DatasetPath,new_path)
    i=i+1    

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值