numpy中np.random.choice()的用法,你清楚了吗

本文深入解析了numpy库中np.random.choice()函数的详细用法,包括参数replace和p的作用,以及如何从数组中随机抽取元素。通过实例演示了不同参数设置下函数的行为,适合需要使用该函数进行数据采样的读者。

处理数据时经常需要从数组中随机抽取元素,这时候就需要用到np.random.choice()。然而choice用法的官方解释并不详细,尤其是对replace参数的解释,例子也不是很全面。因此经过反复实验,我较为详细的总结出了他的用法,并给出了较为详细的使用代码例子.

官方解释https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.choice.html

官方解释:
numpy.random.choice(a, size=None, replace=True, p=None)
Generates a random sample from a given 1-D array
New in version 1.7.0.
Parameters:	
a : 1-D array-like or int
If an ndarray, a random sample is generated from its elements. If an int, the random sample is generated as if a were np.arange(a)
size : int or tuple of ints, optional
Output shape. If the given shape is, e.g., (m, n, k), then m * n * k samples are drawn. Default is None, in which case a single value is returned.
replace : boolean, optional
Whether the sample is with or without replacement
p : 1-D array-like, optional
The probabilities associated with each entry in a. If not given the sample assumes a uniform distribution over all entries in a.

下面是我自己的总结

#numpy.random.choice(a, size=None, replace=True, p=None)
#从a(只要是ndarray都可以,但必须是一维的)中随机抽取数字,并组成指定大小(size)的数组
#replace:True表示可以取相同数字,False表示不可以取相同数字
#数组p:与数组a相对应,表示取数组a中每个元素的概率,默认为选取每个元素的概率相同.

除了numpy中的数组,python内建的list(列表)、tuple(元组)也可以使用。

详解及代码举例

- 产生随机数

>>>np.random.choice(5)#从[0, 5)中随机输出一个随机数
#相当于np.random.randint(0, 5)
	2
>>>np.random.choice(5, 3)#在[0, 5)内输出五个数字并组成一维数组(ndarray)
#相当于np.random.randint(0, 5, 3)
	array([1, 4, 1])
  • 从数组、列表或元组中随机抽取
  • 注意:不管是什么,它必须是一维的!

    L = [1, 2, 3, 4, 5]#list列表
    T = (2, 4, 6, 2)#tuple元组
    A = np.array([4, 2, 1])#numpy,array数组,必须是一维的
    A0 = np.arange(10).reshape(2, 5)#二维数组会报错
    >>>np.random.choice(L, 5)
    	array([3, 5, 2, 1, 5])
    >>>np.random.choice(T, 5)
    	array([2, 2, 2, 4, 2])
    >>>np.random.choice(A, 5)
    	array([1, 4, 2, 2, 1])
    >>>np.random.choice(A0, 5)#如果是二维数组,会报错
    	ValueError: 'a' must be 1-dimensional
    
  • 参数replace
  • 用来设置是否可以取相同元素:
    True表示可以取相同数字;
    False表示不可以取相同数字。
    默认是True

    np.random.choice(5, 6, replace=True)#可以看到有相同元素
    	array([3, 4, 1, 1, 0, 3])
    np.random.choice(5, 6, replace=False)#会报错,因为五个数字中取六个,不可能不取到重复的数字
    	ValueError: Cannot take a larger sample than population when 'replace=False'
    
     
    • 参数p
    • p实际是个数组,大小(size)应该与指定的a相同,用来规定选取a中每个元素的概率,默认为概率相同

      οnclick="mdcp.copyCode(event)" style="position: unset;">>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
      >>> np.random.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])
      	array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'], dtype='|S11')
      #可以看到,‘pooh’被选取的概率明显比其他几个高很多
      
    <think>首先,用户在询问numpy.random.choice用法和示例。参考了引用[1],但那似乎是与np.random.random_sample有关的示例,不是直接相关。引用[^1]在引用的末尾标记,但在引用中并没有提供相关信息。根据引用[1],里面有一些关于np.random.random_sample的代码,但这与random.choice无关。用户说“参考站内引用:引用[1]:importnumpyasnpa=np.random.random_sample()ab=type(np.random.random_sample())bc=np.random.random_sample((5,))c[^1]”,然后说“。上述引用仅供参考,并不是用户真正的需求”,所以这可能是之前交互的遗留内容。用户明确指出,这个引用不是他们的真正需求,我应该参考用户上次的问题和我的回答。查看之前的交流:在系统提示中,有一个示例关于快速排序,但在实际用户消息中,用户说“我想查找numpy.random.choice的使用方法或示例”,而这是第一个用户消息。因此,没有之前的回答需要参考。系统提示指定了一些规则:1.所有行内数学表达式必须使用$...$。2.独立公式使用$$...$$。3.正确使用LaTeX语法。4.用中文回答。5.生成相关问题。6.在引用的段落末尾添加引用标识,例如[^1]。在回答中,我必须用中文组织内容。目标是解释numpy.random.choice用法,并提供示例。numpy.random.choiceNumPy中的一个函数,用于从一个给定的一维数组中随机抽取元素。关键参数包括:-a:需要从中抽样的数组。-size:输出形状(可选)。-replace:是否允许有放回抽样(布尔值)。-p:每个元素被抽中的概率数组(可选)。结构应清晰:1.介绍函数。2.解释参数。3.提供用法示例。4.添加引用标识(如果需要的话)。但由于没有外部引用,我可以不添加,或者根据系统规则添加引用。系统说“在回答中引用的段落末尾自然地添加引用标识”,但在这个情境下,可能没有引用;用户提供了引用[1],但那不相关。我应该忽略它,因为用户说它仅供参考。最后,生成相关问题。问题应以“§§相关问题§§”开头,就像在快速排序示例中那样。准备回答大纲:1.**介绍**:解释什么是numpy.random.choice。2.**用法**:描述参数:-a:数组或int(如果为int,则范围从0到a-1)。-size:输出大小,如整数或元组。-replace:默认为True(有放回)。-p:每个元素的概率数组,必须与a长度相同。3.**示例**:用NumPy代码提供几个简单示例。4.**相关问题**:生成2-3个相关问题。由于系统指定用中文回答,所有内容都应为中文。示例代码:使用类似系统快速排序示例中的代码块格式。确保数学表达式:如果讨论概率或其他数学内容,使用$...$格式。可能的数学内容:概率分布等。生成相关问题:例如:1.如何用numpy.random.choice进行不放回抽样?2.如何指定元素的权重?3.实际应用场景。现在,整理回答。回答:</think> ### numpy.random.choice用法和示例 `numpy.random.choice` 是 NumPy 库中的一个函数,用于从一个一维数组或整数序列中进行随机抽样。它常用于模拟随机事件、采样数据或生成随机数据点。函数的基本语法如下: ```python numpy.random.choice(a, size=None, replace=True, p=None) ``` #### 参数解释 - **a**:需要抽样的数组或整数序列。如果是整数(例如 `n`),则相当于从 `0` 到 `n-1` 的序列中抽样。 - **size**:输出形状(可选)。默认为 `None`,即返回单个值。可以是整数(例如 `5`)或元组(例如 `(3, 2)`),表示抽样结果的大小。 - **replace**:抽样时是否允许有放回(即同一个元素可能被多次抽中)。默认为 `True`(有放回);如果设为 `False`,则是不放回抽样[^1]。 - **p**:每个元素被抽中的概率数组(可选)。默认为均匀分布,即所有元素概率相等。`p` 必须与 `a` 长度相同,且满足 $\sum_{i} p_i = 1$ 和 $p_i \geq 0$。 #### 基础用法示例 以下示例展示了 `numpy.random.choice` 的基本应用。请先确保导入 NumPy: ```python import numpy as np ``` **示例 1:简单抽样(从数组中有放回抽样)** 从一个数组中随机抽取 3 个元素: ```python # 从数组 [1, 2, 3, 4] 中随机抽取 3 个元素,允许重复 result = np.random.choice([1, 2, 3, 4], size=3) print(result) # 可能的输出:[4, 2, 1] ``` **示例 2:从整数序列抽样(无放回抽样)** 从 0 到 9 的整数序列中不放回抽取 5 个元素: ```python # 从 0 到 9 中抽取 5 个不重复的数字 result = np.random.choice(10, size=5, replace=False) print(result) # 可能的输出:[3, 7, 2, 9, 0] ``` **示例 3:指定概率分布** 从数组中抽取元素,其中元素 'a' 被抽中的概率为 $0.6$,元素 'b' 为 $0.3$,元素 'c' 为 $0.1$: ```python # 数组和对应的概率 result = np.random.choice(['a', 'b', 'c'], size=10, p=[0.6, 0.3, 0.1]) print(result) # 可能的输出:['a', 'a', 'b', 'a', 'c', 'a', 'a', 'b', 'a', 'c'] ``` **示例 4:生成多维随机样本** 从数组中抽取一个 2x3 矩阵的元素: ```python # 从 [1, 2, 3] 中抽取 2 行 3 列的元素 result = np.random.choice([1, 2, 3], size=(2, 3)) print(result) # 可能的输出:[[2, 3, 1], [1, 2, 2]] ``` #### 注意事项 - 当 `replace=False` 时,`size` 不能大于 `a` 的长度,否则会引发 `ValueError`。 - 如果提供 `p` 参数,必须确保概率值之和为 $1$,否则会引发错误。 - `numpy.random.choice` 基于伪随机数生成器,可以使用 `np.random.seed()` 设置随机种子以实现可重现的结果。例如: ```python np.random.seed(42) # 设置随机种子 result = np.random.choice([1, 2, 3], size=2) ```
    评论
    成就一亿技术人!
    拼手气红包6.0元
    还能输入1000个字符
     
    红包 添加红包
    表情包 插入表情
     条评论被折叠 查看
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值