Python中NumPy库提供的函数——np.random.choice的基本用法

原创已于 2023-11-08 15:24:11 修改 · 2.8k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #numpy #开发语言

于 2023-09-23 21:10:35 首次发布

本文介绍了NumPy库中的random.choice函数的基本用法，包括从数组中随机选择元素及指定样本数量。特别强调了其在实现mini-batch数据处理中的应用，如随机生成训练数据子集。

一、基本用法

它用于从给定数组或序列中进行随机采样。

下面介绍了两种的基本用法：

import numpy as np

# 创建值的数组或序列
data = np.array([1, 2, 3, 4, 5])

# 从数组中随机选择一个元素
random_element = np.random.choice(data)
print(random_element)

# 您还可以指定要绘制的随机样本的数量
random_elements = np.random.choice(data, size=3)
print(random_elements)

在上面的示例中，np.random.choice用于从data数组中随机选择元素。默认情况下，它选择一个元素，但您可以使用参数指定所需的样本数size。

以下是一些常用参数np.random.choice：

a：要从中采样的输入数组或序列。
size：要抽取的样本数。如果未指定，则默认为 1。
replace：如果True，则通过放回进行采样（可以多次选择相同的元素）。如果False，则采样无需放回。
p：输入数组中每个元素的可选概率分布。如果指定，它确定每个元素被选择的概率。

np.random.choice常用于各种应用，包括机器学习中数据增强的随机采样、统计中的引导以及创建随机排列。

二、举例在mini-batch的实现中的一段代码

import numpy as np
train_size = 60000
batch_size = 100
# 获取mini-batch
batch_mask = np.random.choice(60000, 100)
print(batch_mask)

这里，mini-batch的大小为100，需要每次从60000个训练数据中随机取出100个数据（图像数据和正确解标签数据）。