需求
遇到一些情况需要指定概率的条件下生成随机数,比如要生成姓名字符串,随机生成的话一般是两个字的姓名和3个字的姓名概率是一样的,而实际应该是大部分偏向三个字的,所以需要设置3和2的随机比例,比如3个字的占80%,2个字的占20%,找了一圈好像有看到numpy来处理,但是因为个人程序要打包,所以基本放弃了这个,就自己基于random写了个函数
解决方法
代码如下:
def p_random(arr1,arr2):
assert len(arr1) == len(arr2), "Length does not match."
assert sum(arr2) == 1 , "Total rate is not 1."
sup_list = [len(str(i).split(".")[-1]) for i in arr2]
top = 10 ** max(sup_list)
new_rate = [int(i*top) for i in arr2]
rate_arr = []
for i in range(1,len(new_rate)+1):
rate_arr.append(sum(new_rate[:i]))
rand = random.randint(1,top)
data = None
for i in range(len(rate_arr)):
if rand <= rate_arr[i]:
data = arr1[i]
break
return data
使用说明:
1、arr1需要输入各个待选项,arr2需要输入各个待选项的比例
2、arr1和arr2的元素个数需要相等
3、arr2的概率总和要等于1
测试情况:
plist = []
for i in range(100000):
plist.append( p_random([1,2,3],[0.209,0.291,0.5]))
print(Counter(plist))
#输出结果:
Counter({3: 50100, 2: 29132, 1: 20768})
和设置的概率基本是一致的,O了