一、基本用法
它用于从给定数组或序列中进行随机采样。
下面介绍了两种的基本用法:
import numpy as np
# 创建值的数组或序列
data = np.array([1, 2, 3, 4, 5])
# 从数组中随机选择一个元素
random_element = np.random.choice(data)
print(random_element)
# 您还可以指定要绘制的随机样本的数量
random_elements = np.random.choice(data, size=3)
print(random_elements)
在上面的示例中,np.random.choice用于从data数组中随机选择元素。默认情况下,它选择一个元素,但您可以使用参数指定所需的样本数size。
以下是一些常用参数np.random.choice:
a:要从中采样的输入数组或序列。size:要抽取的样本数。如果未指定,则默认为 1。replace:如果True,则通过放回进行采样(可以多次选择相同的元素)。如果False,则采样无需放回。p:输入数组中每个元素的可选概率分布。如果指定,它确定每个元素被选择的概率。
np.random.choice常用于各种应用,包括机器学习中数据增强的随机采样、统计中的引导以及创建随机排列。
二、举例在mini-batch的实现中的一段代码
import numpy as np
train_size = 60000
batch_size = 100
# 获取mini-batch
batch_mask = np.random.choice(60000, 100)
print(batch_mask)
这里,mini-batch的大小为100,需要每次从60000个训练数据中随机取出100个数据(图像数据和正确解标签数据)。
本文介绍了NumPy库中的random.choice函数的基本用法,包括从数组中随机选择元素及指定样本数量。特别强调了其在实现mini-batch数据处理中的应用,如随机生成训练数据子集。
1739

被折叠的 条评论
为什么被折叠?



