问题:1。已知有个rand7()的函数,返回1到7随机自然数,让利用这个rand7()构造rand10() 随机1~10。
2。已知random3()这个随机数产生器生成[1, 3]范围的随机数,请用random3()构造random5()函数,生成[1, 5]的随机数?
3。如何用随机数生成0到n之间的m个不重复的数?
这些都是网上可以看到关于随机数的典型面试题目。考察是对概率知识的理解与应用。1,2属于一类问题并且有属于这类问题的通解。3题有两个经典方法解决。
先看第一个问题的解决代码,下面解释。
int rand_10()
{
int x = 0;
do
{
x = 7 * (rand7() - 1) + rand7();
}while(x > 40);
return x % 10 + 1;
}
rand7()-1得到一个离散整数集合{0,1,2,3,4,5,6},其中每个整数的出现概率都是1/7。那么(rand7()-1)*7得到一个离散整数集合A={0,7,14,21,28,35,42},其中每个整数的出现概率也都是1/7。而rand7()得到的集合B={1,2,3,4,5,6,7}中每个整数出现的概率也是1/7。显然集合A和B中任何两个元素组合可以与1-49之间的一个整数一一对应,也就是说1-49之间的任何一个数,可以唯一确定A和B中两个元素的一种组合方式,反过来也成立。由于A和B中元素可以看成是独立事件,根据独立事件的概率公式P(AB)=P(A)P(B),得到每个组合的概率是1/7*1/7=1/49。因此(rand7()-1)*7+rand7()生成的整数均匀分布在1-49之间,每个数的概率都是1/49。
为什么用while(x>40)而不用while(x>10)呢?原因是如果用while(x>10)则有40/49的概率需要循环while,很有可能死循环了或者循环次数过多。
程序满足x的值小于等于40结束while 循环,所以程序等概率产生1-40 数,然后对10取余等概率产生0-9 最后再加上1满足题目要求等概率产生1-10的随机数。
推理到一般情况:已知random_m()随机数生成器的范围是[1, m] 求random_n()生成[1, n]范围的函数,m < n && n <= m *m
int random_n()
{
int val = 0;
int t; //t为n的最大倍数,且满足t<m*m
do
{
val = m * (random_m() - 1) + random_m();
}while(val > t);
return val%n+1;
}
val 同样获得是1-m*m的等概率分布,t为n的最大倍数且小于m*m 当val小于等于t循环结束,产生等概率1-t的分布,然后进行取余运算加1满足题意要求。
3。如何用随机数生成0到n之间的m个不重复的数?这个问题经常出现空缺代码填空题中,先给出答案再解释。
void mRand(int n ,int m)
{
srand(time(NULL));
for (int i=0;i<n;i++)
{
if(rand()%(n-i)<m)
{
cout<<i<<endl;
m--;
}
}
}
首先是一个循环,这个循环确保了输出的数是不重复的,因为每次的i都不一样
其次是m个数,在每次循环中都会用rand()%(n-i)<m来判断这个数是否小于m,如果符合条件则m减1,直到为0,说明已经取到m个数了
再次是如何保证这m个数是等概率取到的
在第一次循环中i=0, n-i=n, 则随机数生成的是0-n-1之间的随机数,那么此刻0被取到的概率为 m/n-1
在第二次循环中i=1,n-i=n-1,则随机数生成的是0-n-2之间的随机数,这时1被取到的概率就和上一次循环中0有没有取到有关系了。假设在上一次循环中,没有取,则这次取到的1的概率为 m/n-2;假设上一次循环中,已经取到了,那么这次取到1的概率为m-1/n-2,所以总体上这次被取到的概率为 (1-m/n-1)*(m/n-2)+(m/n-1)*(m-1/n-2),最后通分合并之后的结果为m/n-1和第一次的概率一样的
同理,在第i次循环中,i被取上的概率也为m/n-1,所以这m个数是等概率取到的。
方法2:这个问题最直接的方法就是先随机生成一个0到n之间的数,判断这个数是否已被选上,如果以前没选过,则选上,如果以前已选,则进行下一次循环测试。
参考博文:http://blog.youkuaiyun.com/dlengong/article/details/7932579
http://blog.youkuaiyun.com/hackbuteer1/article/details/7486704