《算法导论》中的习题:描述RANDOM(a, b)过程的一种实现,它只调用RANDOM(0, 1)
原理:算出a和b之间的差距d,求得最小的bit位数,使其恰好大于d,通过random(0, 1)来置位二进制位,然后加上a,如果该值落在[a, b]之间,满足条件,否则丢掉改值,继续寻找其他值!
以下是相应实现代码,但今天重点不是代码实现,而是验证随机性。
import java.util.Random;
/**
* 创建时间:2014年11月3日 上午午10:10:21 项目名称:Test
*
* @author Chan Leo
* @since
*/
public class RandomNumbersTest {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
RandomNumbersTest test = new RandomNumbersTest();
int a = 0;
int b = 3;
// System.out.println(getRandomNumber(a, b));
int[] result = new int[b - a + 1];
for (int i = 0; i < 100000; i++) {
int var = test.getRandomNumber(a, b);
for (int j = 0; j <= b - a; j++) {
if (var == j + a) {
result[j]++;
break;
}
}
}
// 打印统计结果分布
for (int var : result) {
System.out.println(a++ + ":" + var);
}
}
public int getRandomNumber(int a, int b) {
int diff = b - a;
int p = getP(diff);
int result = 0;
for (int i = 1; i <= p; i++) {
int random = randomBase();
result = 2 * result + random;
/* 如果r大于b-a,重复第2)步 */
if (result > diff) {
result = 0;
i = 0;
}
}
return result + a;
}
/* 获得最小的p,使得2^p>b-a */
public int getP(int diff) {
for (int i = (int) Math.ceil(Math.log(diff) / Math.log(2));; i++) {
if ((Math.pow(2, i)) > diff) {
return i;
}
}
}
<pre name="code" class="java"><span style="white-space:pre"> </span>/*
* new Random().nextInt(2)用来模拟Random(0,1),注意new
* Random().nextInt(2)表示生成≥0且<2的数,即生成0或1
*/
// 其实如果使用Random().nextInt(2)会发现分布不均匀public int randomBase() {Random r = new Random();return r.nextInt(2);}}
测试RANDOM(0, 3)用for循环10万次后,统计结果为:
0:288091:209582:213503:28883
明显发现分布并不均匀,但算法实现也没出问题,所以回到源头,测验发现了一个问题,就是0或1连续出现的概率要比0和1交替出现的概率大,既然是随机产生0和1,那这四种情况(00,01,10,11)的概率应该相同才对。因此得到的结论就是,Random.nextInt(0, 1)该方法获取的随机数并不是随机,连续出现相同的数字概率高于其他情况,也就是获取0和1事件并不独立,二者会有影响,具体应该是和nextInt(0, 1)方法实现有关。
验证代码:
// 检测Random.nextInt(2),连续获取两位0和1随机数
public int randomBaseS() {
String s = new String(new StringBuffer().append(getBoolean()).append(
getBoolean()));
if ("00".equals(s)) {
return 0;
} else if ("01".equals(s)) {
return 1;
} else if ("10".equals(s)) {
return 2;
} else {
return 3;
}
}
// 获取随机数二进制字符串
public String getBoolean() {
return new String(new Integer(randomBase()).toString());
}
使用for循环10万次后,统计结果为:
00: 28563
01: 21605
10: 21103
11: 28729
最后解决方案就是重写randomBase()实现方法,不通过nextInt(0, 1)方法来获取。
public int randomBase() {
return Math.random()>0.5?1:0;
}
以上面的方法,进行统计循环10万次结果:
00: 24956
01: 24909
10: 25130
11: 25005
发现趋于均匀分布。
使用修改后的获取0和1方法,测试RANDOM(0, 3)用for循环10万次后,统计结果为:
0:24895
1:25064
2:24931
3:25110
结果同样是均匀,至此RANDOM方法的随机性问题已解决。