Python中NumPy库提供的函数——np.random.permutation的基本用法

最新推荐文章于 2025-05-28 23:37:43 发布

原创最新推荐文章于 2025-05-28 23:37:43 发布 · 2.5k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #numpy #开发语言

文章介绍了NumPy库中的np.random.permutation函数，用于生成随机排列，常用于数据随机化，如打乱训练数据和标签对以提升模型泛化性能。示例代码展示了如何在shuffle_dataset函数中使用该功能。

一、基本用法：

np.random.permutation是 NumPy 库中的一个函数，用于返回一个随机排列（重置）给定的副本的副本。与不同的情况，不会修改np.random.shuffle原始np.random.permutation副本，而是返回一个新的副本，其中包含原始副本元素的随机排列。

该函数的基本语法如下：

numpy.random.permutation(x)

其中，x是要随机排列的数组或整数。如果x是一个整数n，则函数将返回一个包含范围[0, n)内整数的随机排列。

示例用法：

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
permuted_arr = np.random.permutation(arr)
print(permuted_arr)  # 可能输出类似 [3, 1, 4, 5, 2] 的随机排列

# 随机排列整数范围
permuted_range = np.random.permutation(10)
print(permuted_range)  # 可能输出类似 [4, 2, 8, 1, 9, 0, 7, 3, 5, 6] 的随机排列

np.random.permutation可以用于数据的随机化，生成随机的索引顺序，也可以用于生成经常随机的样本或数据排列。这在数据处理和深度学习中有用。

二、实战代码举例：

def shuffle_dataset(x, t):
    """打乱数据集

    Parameters
    ----------
    x : 训练数据
    t : 监督数据

    Returns
    -------
    x, t : 打乱的训练数据和监督数据
    """
    permutation = np.random.permutation(x.shape[0])
    x = x[permutation,:] if x.ndim == 2 else x[permutation,:,:,:]
    t = t[permutation]

    return x, t

上述代码定义了一个名为shuffle_dataset的函数，用于随机打乱输入数据x和对应的标签t。它的作用是保证数据和标签的顺序是随机的，通常用于数据集的计算，以提高训练模型的随机性和泛化性能。

下面是这个函数的详细解释：

permutation = np.random.permutation(x.shape[0])：首先，生成一个包含x样本数量（行数）的随机排列（排列）。该排列被存储在permutation变量中，用于打乱数据的顺序。
x = x[permutation,:] if x.ndim == 2 else x[permutation,:,:,:]：接下来，根据x维度来选择合适的索引方式，重新排列x的行。如果x是二维阵列（例如，样本数 x 特征数），则将重新排列；如果x是三维阵列（例如，样本数） x通道x高度x宽度），则将通道方向的数据也重新排列。这确保了数据和标签的对应关系不会被破坏。
t = t[permutation]：对应，标签t也按照相同的随机排列重新排列，以确保每个标签与对应的数据仍然匹配。
最后，函数返回重新排列后面的数据x和标签t。

通过调用该函数，可以在每个训练周期或数据加载时随机打乱数据的顺序，这有助于模型更好地学习数据的分布，并提高模型的泛化性能。