分割分类数据集

该Python代码用于将指定文件夹下的图像按比例划分为训练集和验证集。它首先定义了各个情感类别的文件夹路径,然后计算出验证集所需的图片数量。接着,它打乱图片列表并将图片移动到新建的train和val文件夹中,分别对应训练和验证集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分割分类数据集

# -*-coding: utf-8 -*-
import os
import random
import shutil

# 定义各个文件夹的路径
parent_folder = "./"
a_folder = os.path.join(parent_folder, "angry")
b_folder = os.path.join(parent_folder, "happy")
c_folder = os.path.join(parent_folder, "relaxed")
d_folder = os.path.join(parent_folder, "sad")

# 计算每个文件夹中要划分为验证集的图片数量
val_ratio = 0.1
a_val_size = int(val_ratio * len(os.listdir(a_folder)))
b_val_size = int(val_ratio * len(os.listdir(b_folder)))
c_val_size = int(val_ratio * len(os.listdir(c_folder))) 
d_val_size = int(val_ratio * len(os.listdir(d_folder)))

# 分别对每个文件夹进行处理,将图片移动到 train/ 和 val/ 目录中
train_folder = os.path.join(parent_folder, "train")
val_folder = os.path.join(parent_folder, "val")
os.makedirs(train_folder, exist_ok=True)
os.makedirs(val_folder, exist_ok=True)
for folder in [a_folder, b_folder, c_folder, d_folder]:
    filenames = os.listdir(folder)
    random.shuffle(filenames)  # 打乱文件顺序
    val_filenames = set(filenames[:a_val_size])
    train_filenames = set(filenames[a_val_size:])

    # 移动文件到 train/ 或 val/ 目录中的子文件夹中
    for filename in train_filenames:
        src_path = os.path.join(folder, filename)
        print(train_folder)
        os.makedirs(os.path.join(train_folder, os.path.basename(folder)), exist_ok = True)
        dst_path = os.path.join(train_folder, os.path.basename(folder), filename)
        shutil.copy(src_path, dst_path)
    for filename in val_filenames:
        src_path = os.path.join(folder, filename)
        os.makedirs(os.path.join(train_folder, os.path.basename(folder)), exist_ok = True)
        dst_path = os.path.join(val_folder, os.path.basename(folder), filename)
        shutil.copy(src_path, dst_path)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东哥aigc

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值