关于本章的问题和算法描述与改进,在一篇其他人的博客里总结已经很详细了。博客地址:http://blog.youkuaiyun.com/neicole/article/details/8518602。
基于本章的介绍,我想通过这些程序来产生一些大数据文件,然后供以后的算法学习使用。总共想产生,三种文件:100W有序的不重复的随机整数、100W无序的不重复随机整数和100W无序的可重复的随机整数。这些数据全部是小于1KW的。经过编程实践,遇到几个问题,在这里记录之。
- 关于课后习题1中,大随机数问题。C库函数rand()通常返回约15个随机位。使用改函数实现函数bigrand()和randint(l,u)。要求前者至少返回30个随机位,后者返回[l,u]范围内的随机整数。
int bigrand() { return RAND_MAX*rand()+rand(); } int randint(int l,int u) { return l+bigrand()%(u-l+1); }
其中关于RADN_MAX在一般windows情况下,比如vc里面,大小是:32767,即0x7FFF。但是在gnu环境下,RAND_MAX大小是2^31-1,所以在产生大随机数的时候,就不需要重新定义bigrand()函数了。如果不确定,可以在程序里把RAND_MAX打印出来看看。不然的话,会出现负的随机数。。。尤其是在linux中执行下面的程序时,内核崩溃。 - 关于第三种方法,也即把包含整数0~n-1的数组顺序随机打乱,然后把前m个元素排序输出。
void genshuf(int m,int n) { int i,j; int *x = new int[n]; for(i = 0;i<n;i++) x[i] = i; for(i =0;i<m;i++) { j = randint(i,n-1); int t = x[i]; x[i] = x[j]; x[j] = t; } sort(x,x+m); for(i = 0;i<m;i++) cout<<x[i]<<"\n"; }
上面是书中的代码,在该代码中new的一个对象,没有销毁,需要最后加一句 delete x;。如果要产生的随机数不按顺序输出,可以直接在上面的代码中,把sort(x,x+m)这一行去掉就行。至于把输出结果放到文件中,在linux下,直接执行指令:./a.out >out.txt 。 - 至于课后习题。后续再加。