用python实现一种实用型抽样/多维索引生成方法

最新推荐文章于 2025-04-21 14:23:06 发布

原创最新推荐文章于 2025-04-21 14:23:06 发布 · 397 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #random #蒙特卡洛

Re.轮子专栏收录该内容

7 篇文章

订阅专栏

本文介绍了两个Python轮子，轮子1可生成维数任意、各维度长度可指定的索引组合遍历；轮子2基于轮子1，支持放回/不放回抽样，适用于蒙特卡洛过程。作者分享造轮子经历，还展示了轮子使用效果，其基于random模块，每次输出不同。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

既然倒霉与蛋疼的事情有时候真·无能为力，写点东西能舒缓心情，就小写一篇。

其中有两个轮子，

轮子1：生成维数任意的索引组合的遍历，每个维度长度可指定；（有一说一，实现方式还是很dirty）

轮子2：基于轮子1的一个抽样方法，支持放回/不放回的抽样，比较适用于各种蒙特卡洛过程。

说件比较舒适的事情，本人喜欢造各种轮子，但如果造完没有继续使用/重构优化再使用，那么其实没啥意义。轮子1呢是我大约半年前就造出来了，当时似乎是为了解决深度学习中构造一种更通用的onehot编码，通用其实除了维度可扩展之外而且也不是onehot了（这块轮子内容后面有空再表吧）。于是最近写图像检测相关的算法时居然又需要这个轮子1以及在其基础上造的轮子2（关于这个图像检测的轮子也以后再说）。然后顺利的找到了之前的方法，这个感觉就很不错了。

这件舒适的事情就发生在昨天，同样是在昨天丢了东西，但是今天才发现。

如果仅仅只是有用的时候才想起，那么当你再想起的时候找不见的机会会更大。 ----丢东西和丢人都适用这个特性

下面废话不多说，上轮子，只有短短几行，活用eval，实现了不俗的功能。其实光听轮子名和演示结果，就应该很好理解：

import random


def nd_inx_li(nd_shape):
    """
    产生任意维度的shape下的所有索引的组合
    :param nd_shape: 维度信息 如 (5,4)
    :return: 输出为所有索引组合的列表，可直接迭代，列表元素为tuple，每个tuple的长度等于维度数
    """
    iter_li = ['for x%s in range(%s)' % (ix, nd_shape[ix]) for ix in range(len(nd_shape))]
    iter_ss = ' '.join(iter_li)
    tuple_ss = '(%s,)' % ','.join(['x%s' % ix for ix in range(len(nd_shape))])
    return eval('[%s %s]' % (tuple_ss, iter_ss))  # pix 索引的-1维度的位置


def random_arrange_nd(nd_shape, length=10, with_playback=False):
    """
    任意维度所有排列的随机抽取输出，注意不是组合
    :param nd_shape: 维度信息 如 (5,4)
    :param length:  抽取次数
    :param with_playback: 是否有放回
    :return: 和 nd_inx_li的输出格式一致
    """
    inx_li = nd_inx_li(nd_shape)
    if with_playback:
        return [random.choice(inx_li) for _ in range(length)]
    else:
        random.shuffle(inx_li)
        return inx_li[:length]

轮子1就是nd_inx_li方法，看下使用它的效果：