素数

原创于 2018-07-18 15:41:58 发布 · 538 阅读

1 ·

CC 4.0 BY-SA版权

数论与数学方法专栏收录该内容

11 篇文章

订阅专栏

从最基础的讲起

素数，也称质数，指大于1，且不被除1与它本身以外的其它数整除的数。

朴素的求素数表的方法是直接枚举每个数，判断它是否是素数。

而判断 $x$ 是否为素数的方法，最朴素的是枚举 $2$ 到 $x-1$ 判断是否整除，若都无法整除则为素数。

for (int i=2;i<=n;i++)
{
    bool flag=false;
    for (int j=2;j<i;j++)
        if (i%j==0)
        {
            flag=true;
            break;
        }
    if (!flag) prime[++cnt]=i; //加入素数表
}

从代码可以看出，如果要求 $n$ 以内的所有素数，则时间复杂度为 $O(n^{2})$ 。

改进判断素数的方法

容易发现，若 $n$ 对 $a$ 取模的结果为0，那么因为 $a*\frac{n}{a}=n$ ，则 $n$ 对 $\frac{n}{a}$ 取模的结果也等于0；这即是说，判断前 $\sqrt{n}$ 个数与判断后 $\sqrt{n}$ 个数是等价的（ $\sqrt{n}*\sqrt{n}=n$ ）。那么，我们只用枚举 $2$ 到 $\sqrt{n}$ 即可，时间复杂度降为 $O(n\sqrt{n})$ .。

代码是差不多的，只是枚举的上限变了：

for (int i=2;i<=n;i++)
{
    bool flag=false;
    for (int j=2;j<=int(sqrt(i));j++)
        if (i%j==0)
        {
            flag=true;
            break;
        }
    if (!flag) prime[++cnt]=i;
}

其它判断素数的方法

费马小定理：如果 $p$ 为素数且 $a$ 模 $p$ 不等于0，那么 $a^{p-1}\equiv 1\left (mod$ $p)$ 。

（ $\equiv$ 表示同余，可以理解为 $a^{p-1}$ 对 $p$ 取模的值为1）

利用这一性质，我们可以随机选取几个 $p$ ，利用快速幂判断余数是否都为1，若否，则不为素数。算法复杂度为 $O(logp)$ 。

另外也有一种方法更为简单。首先，如果一个数是偶数，那它一定不为素数；而如果数 $n$ 为奇合数，那么至少存在 $\frac{n-1}{2}$ 个能证明它为合数的数，亦即是说，每选一个数出来约有 $\frac{1}{2}$ 的概率检验成功，那么选k个数检验失败的概率为 $\frac{1}{2^{k}}$ ，出错概率极小。时间复杂度为 $O(k)$ 。

当然，上述两种都是随机化算法，有一定概率出错，一般是不需要用的。

改进筛选素数的方法

素数筛法有两种。

根据素数的唯一分解定理：任意一个数 $a$ 都能分解为 $n=\prod p_{i}^{a_{i}}$ ，其中 $p_{i}$ 为质因数。我们可以在筛选素数的时候标记合数。

（唯一分解定律也用来分解质因数）

用 $flag$ 的布尔型数组标记合数，在枚举到某个数时，除了用 $flag$ 判断其是否为素数，还要与素数表里的其它素数相乘标记后面的合数。

可以证明：若枚举到 $i$ 为止， $i$ 仍未被标记，那么 $i$ 为素数。（因为不可能从更大的数标记到更小的数）

for (int i=2;i<=n;i++)
{
    if (!flag[i]) prime[++cnt]=i;
    for (int j=1;j<=cnt;j++)
        if (i*prime[j]<=n)
            flag[i*prime[j]]=true;
}

另一种是时间复杂度为 $O(n)$ 的欧拉线性筛。为了保证高效率，需要保证每个合数只被标记一次。

注意观察代码的不同：

for (int i=2;i<=n;i++)
{
    if (!flag[i]) prime[++cnt]=i;
    for (int j=1;j<=cnt;j++)
    {
        if (i*prime[j]<=n) flag[i*prime[j]]=true;
        if (i%prime[j]==0) break; //重点！保证不被重复标记
    }
}