python训练数据时打乱训练数据与标签的两种方法

本文介绍使用Python的NumPy库实现数据集打乱的两种方法:一种通过打乱索引来节省内存并确保每次打乱不同;另一种利用随机数种子直接打乱数据,保证每次打乱顺序一致。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import numpy as np  
  
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])  
y = np.array([1,2,3,4,5])
  
print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------'  
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])  
data_num, _= data.shape #得到样本数  
index = np.arange(data_num)  # 生成下标  
np.random.shuffle(index)  
print '-------原数据:----------'  
print '数据:',data  
print '标签:', y
print '-------打乱数据:----------'  
print '数据:',data[index]  
print '标签:',y[index]

print '-------第2种方法:直接的打乱数据,利用随机数种子,好处:每次打乱的顺序是固定的----------'  
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])  
y = np.array([1,2,3,4,5])

print '-------原数据:----------'  
print '数据:',data  
print '标签:', y
print '-------打乱数据:----------'  
np.random.seed(116)
np.random.shuffle(data) 
np.random.seed(116)
np.random.shuffle(y) 
print '数据:',data  
print '标签:', y


评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值