生成伪随机数的新思路 ——借助RSA算法

最新推荐文章于 2024-09-16 22:39:45 发布

奋斗_小伙

最新推荐文章于 2024-09-16 22:39:45 发布

阅读量2.6k

点赞数 1

分类专栏：高级程序员必备文章标签： c 语言 c++ 密码学数学

高级程序员必备专栏收录该内容

10 篇文章

订阅专栏

转自：http://www.chncla.com/yk/201006/p_7.html

最近浏览“程序员论坛”时发现不少好帖，增长了不少知识，现拿其中一则为例与大家共同分享心得。

某人提出一个问题：怎样才能生成一亿个不重复的随机数？

　　问题表述起来很简单，似乎只要弄明白什么叫随机数以及怎样用电脑生成随机数，就能解决问题。

　　随机数，个人理解为一定范围内出现的毫无规律的数，比如扔一个骰子，落在桌面上时朝上的一面所表示的数就是随机数，这个数只能在1到6的范围内，但具体是什么数，谁也不能肯定，因为它没有规律。一组不重复的随机数，对扔骰子来说就是扔出六个不一样的数来，再比如洗一次扑克牌，洗完后就是54张不重复的随机数。

　　第二个问题，怎么样用电脑生成随机数？只要调用某个语言的某个函数即可。其实电脑是没办法生成真正的随机数，因为电脑是高度有规律的机器，让它生成一个没规律的数，根本办不到。平时程序员用某个函数生成的随机数，只是利用某个算法弄出来的伪随机数，看起来像，其实不是，能解决问题就行。

　　回到这个帖子所描述的问题上来。生成一亿个不重复的随机数，最直接的算法就是每用函数生成一个数，就把它放在一个筐里，第一个数直接放到筐里，以后生成的数在放到筐里之前和筐里的每一个数比较一番，一旦发现筐里有和新生成的数一样的数时，丢掉这个新生成的数，再接着生成数。

　　毫无疑问，这种算法的效率非常低，看看其中的比较次数就知道了，最差的次数趋于无穷次。也就是说到后来，几乎生成不了和以往不同的数。

　　当然还可以将这个算法升级为效率高得多的算法，每生成一个数，把这个数从随机数生成器取的范围中去掉，比如要生成10个随机数，第一次生成一个3，我把3从随机数的范围中去掉，第二次只从1到9这个范围内找。3对应4，4对应5……9对应10。这样就不存在比较的环节，然而又多出一个对应的环节，每生成一个数之后就要把剩下的数重新对应一遍，效率也不容乐观。

　　目前以我为代表的普通程序员的想象力也就到此为止，想不出什么高级解决办法，就当扔一块砖头出来，下面就把真正的碧玉——数学家级程序员的算法隆重介绍请出来。

　　我们先用另一种眼光来看不重复的随机数：加密。把一个能看懂的英文字符串打乱字母的顺序，变成不可读，这就是加密。但必须得有规律地打乱，字母a对应另外一个固定的字母Ax，字母b对应另外一个固定的字母Bx，以此类推，而且必须一一对应的。那么字符串“ab…z”这26个字母对应的26个加密字母“AxBx和Zx”就可以看成是对应范围a到z的不重复的伪随机数，这就是数学家的算法的来源。

　　看看回帖者的原文：

　　“可以采用32bit RSA算法
　　设A从2~(N-1) 
　　C=（A EXP D)  mod N 
　　满足如下条件： 
　　D是素数，N是两个素数(P,Q)之积， 
　　(D * E) mod ((P-1) * (Q-1))=1 
　　因为：若 
　　C=(A EXP D)mod N 
　　有： 
　　A=(C EXP E) mod N 
　　所以，C与A 一一对应。 
　　所以，对于A=2~(N-1),有不重复，无遗漏的伪随机码Ｃ。”

　　凡是稍微扯上一点数学，尤其是高等数学的问题，我等泛泛之辈看起来就有点费劲，这里虽然文字不长，但是还得慢慢来看。

　　这里面RSA算法是密码学三大算法之一(RSA、MD5、DES)，是一种不对称密码算法。说如果满足条件：D是素数，N是两个素数(P,Q)之积，(D * E) mod ((P-1) * (Q-1))=1，那么存在Ｃ与Ａ（范围从２到Ｎ－１）一一对应，且Ｃ＝(A EXP D)mod N。Ａ是一个有顺序的数，Ｃ就是一个看似无规律的伪随机数。Mod运算表示求模，例如7Mod3=1。意思是７除以３余１。类似地8Mod3=2,9Mod3=0。EXP表示前面数的后面数次方，ＡEXPＤ表示Ａ的Ｄ次方。这两个运算清楚了，其它的也就没什么困难的了，*是乘法的意思，大多数理科生都清楚。

　　搜了一下网络，还得加上一些条件，1,Ｐ和Ｑ不能一样。2,e<(Ｐ-1)(Ｑ-1)且e与（Ｐ-1）(Ｑ-1)的最大公因数为１。

下面我们介绍RSA算法，该算法用到下列元素：

两个素数 p,q (保密的，选定的)

n=pq (公开的，计算得出的)

e满足 gcd( Φ(n), e) =1; 1<e<Φ(n） (公开的，选定的) Φ(n) =(p-1)(q-1) 公钥为{e,n}

　　下面用一个例子来试验一下，看看这个算法有多神奇。

　　设Ｎ＝１５，Ｐ＝５，Ｑ＝３，则Ａ为２到14的数。现在要产生２到14的伪随机数。取 E为３，

　　Ｃ２＝（２EXP３）mod１５ = 8,　　

　　Ｃ３＝（３EXP３）mod １５ = １２,
　　Ｃ４＝（４EXP３）mod １５= ４，
　　Ｃ５＝（５EXP３）mod １５= ５，
　　Ｃ６＝（６EXP３）mod １５= ６，
　　Ｃ７＝（７EXP３）mod １５= １３，
　　Ｃ８＝（８EXP３）mod １５= ２，
　　Ｃ９＝（９EXP３）mod １５= ９，
　　Ｃ１０＝（１０EXP３）mod １５= １０，
　　Ｃ１１＝（１１EXP３）mod １５= １１，
　　Ｃ１２＝（１２EXP３）mod １５= ３，
　　Ｃ１３＝（１３EXP３）mod １５= ７，
　　Ｃ１４＝（１４EXP３）mod １５= １４。

　　比较完美，如果数再大一点，可能看起来更随机一些。

　　由这个算法产生的１亿的伪随机数，效率那可是相当的高，只不过运算时要用到大数运算库。在一些讲求效率的场合应用的话，再做一些对应上的处理，升级一下算法，那定是相当的完美。

快速幂取模运算：

#include <iostream>
using namespace std;

//计算a^bmodn
int modexp(int a,int b,int n)
{
int ret=1;
int tmp=a;
while(b)
{
//奇数存在
if(b&0x1) ret=ret*tmp%n;
tmp=tmp*tmp%n;
b>>=1;
}
return ret;
}

int main()
{
cout<<modexp(2,10,3)<<endl;
return 0;

}

参考：秦九韶算法(http://baike.baidu.com/view/1431260.htm)

利用了二分的思想，可以达到O(logn)。
可以把b按二进制展开为：b = p(n)*2^n + p(n-1)*2^(n-1) +…+ p(1)*2 + p(0)
其中p(i) (0<=i<=n)为 0 或 1
这样 a^b = a^ (p(n)*2^n + p(n-1)*2^(n-1) +...+ p(1)*2 + p(0))
= a^(p(n)*2^n) * a^(p(n-1)*2^(n-1)) *...* a^(p(1)*2) * a^p(0)
对于p(i)=0的情况, a^（p(i) * 2^(i-1) ） = a^0 = 1,不用处理
我们要考虑的仅仅是p(i)=1的情况
化简：a^(2^i) = a^(2^(i-1) * 2) = ( a^( p(i) * 2^(i-1) ) )^2
利用这一点，我们可以递推地算出所有的a^(2^i)
当然由算法1的结论，我们加上取模运算：
a^(2^i)%c = ( (a^(2^(i-1))%c) * a^(2^(i-1))) %c
于是再把所有满足p(i)=1的a^(2^i)%c按照算法1乘起来再%c就是结果，即二进制扫描从最高位一直扫描到最低位

　　由此可以看出，算法的优化，如果仅仅停留在大脑能够想象到的小学数学的阶段，那是远远达不到要求。一个优秀的程序员，还需要加深对离散数学的理解，虽然，这次提到的算法已经深入到了数论的层次上了，但是RSA算法已经是应用非常广泛的算法，对其稍加变通，便可以发挥出更加不可思议的作用。程序员还是需要多学习算法，多学习数学，才能发挥出超出一般程序员的不可思议的能力。

引用：http://www.purpleroc.com/html/087943.html

相关文章：

位运算之——按位与（&）操作——（快速取模算法）
http://blog.sina.com.cn/s/blog_7b7cad23010163vy.html
快速幂取模
http://blog.youkuaiyun.com/on_1y/article/details/7989603
快速幂取模算法
http://blog.chinaunix.net/uid-26602509-id-3299184.htm