给定数据集data,数据集对应的标签label
index = [i for i in range(len(data))]
random.shuffle(index)
data = data[index]
label = label[index]
(1)首先,获得数据集的所有index,其实就是0,1,2,....,num-1(这里的num是数据集中含有的examples的个数,注意,python的索引是从0开始的,所以,第一个元素索引为0,最后一个元素索引为num-1)
【数据集中函数的样本个数num=sampNum = len(data)】
index = [i for i in range(len(data))]
(2)将索引随机打乱顺序
random.shuffle(index)
(3)按照新的乱序索引得到新的乱序后的data和label
data = data[index]
label = label[index]
本文介绍了如何在Python中对数据集进行随机化处理,包括获取数据集的索引、随机打乱索引顺序以及使用新索引重新排列数据集和标签。详细步骤确保了数据集的随机性和数据增强的可能性。
3342





