Python 随机划分训练和验证集 保存成pkl

此篇博客介绍了如何使用Python获取目录下的nii文件,并将图像和标签列表按8:2的比例随机划分成训练集和验证集,然后将结果分别保存为pkl文件。通过get_train_val_list函数读取文件,write_pkl函数实现数据划分和存储。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import os
import pickle
import numpy as np

def get_train_val_list(work_path):
    '''
    todo:   get train val list 
    '''
    image_list = []
    mask_list = []
    case_list = os.listdir(work_path)   
    case_list.sort()
    for case in case_list:
        case_path = os.path.join(work_path, case)
        origin_case_path = os.path.join(case_path, 'origin.nii.gz') 
        mask_case_path = os.path.join(case_path, 'label.nii.gz')  
        image_list.append(origin_case_path)
        mask_list.append(mask_case_path)
    return image_list, mask_list

def write_pkl(save_path, image_list, mask_list):
    '''
    todo:   write train_list and val_list as 8:2 to pkl
    '''
    with open(os.path.join(save_path, 'train.pkl'), "wb") as train_pkl, open(os.path.join(save_path, 'val.pkl'), "wb") as val_pkl:
        data = dict()
        for i in range(len(image_list)):
            data['image_path'] = image_list[i]
            data['mask_path'] = mask_list[i]

            # split train and val data
            if np.random.random()<0.8:
                pickle.dump(data, train_pkl)
            else:
                pickle.dump(data, val_pkl)

def main():
    root_path = '/data/xx/nii'
    save_path = '/home/yy'
    image_list, mask_list = get_train_val_list(root_path)
    write_pkl(save_path,image_list, mask_list)
if __name__=="__main__":
    main()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值