转自:http://www.voidcn.com/article/p-xdalwngx-kh.html
转自:https://blog.youkuaiyun.com/qq_41668093/article/details/83793264
PS:作为笔记转载别人博客
素数总是一个比较常涉及到的内容,掌握求素数的方法是一项基本功。
基本原则就是题目如果只需要判断少量数字是否为素数,直接枚举因子2 。。N^(0.5) ,看看能否整除N。
如果需要判断的次数较多,则先用下面介绍的办法预处理。
一般的线性筛法
首先先介绍一般的线性筛法求素数
void make_prime() {
memset(prime, 1, sizeof(prime));// 假设全是素数
prime[0]=false; // 0: 非素数
prime[1]=false; // 1: 非素数
int N=31700;
for (int i=2; i<N; i++) // i是素数
if (prime[i]) { // 将素数i保存到bPrimes[]中
primes[++cnt ]=i;
for (int k=i*i; k<N; k+=i) // 作筛选: i的倍数都不是素数
prime[k]=false; // 将素数i的倍数全置为非素数标志
}
return;
}
这种方法比较好理解,初始时,假设全部都是素数,当找到一个素数时,显然这个素数乘上另外一个数之后都是合数(注意上面的 ii , 比 i2 要快点 ),把这些合数都筛掉,即算法名字的由来。
但仔细分析能发现,这种方法会造成重复筛除合数,影响效率。比如10,在i=2的时候,k=215筛了一次;在i=5,k=56 的时候又筛了一次。所以,也就有了快速线性筛法。
快速线性筛法
快速线性筛法没有冗余,不会重复筛除一个数,所以“几乎”是线性的,虽然从代码上分析,时间复杂度并不是O(n)。先上代码
#include<iostream>
using namespace std;
const long N = 200000;
long prime[N] = {0},num_prime = 0;
int isNotPrime[N] = {1, 1};
int main()
{
for(long i = 2 ; i < N ; i ++)
{
if(! isNotPrime[i])
prime[num_prime ++]=i;
//关键处1
for(long j = 0 ; j < num_prime && i * prime[j] < N ; j ++)
{
isNotPrime[i * prime[j]] = 1;
if( !(i % prime[j] ) ) //关键处2
break;
}
}
return 0;
}
首先,先明确一个条件,任何合数都能表示成一系列素数的积。
不管 i 是否是素数,都会执行到“关键处1”,
①如果 i 都是是素数的话,那简单,一个大的素数 i 乘以不大于 i 的素数,这样筛除的数跟之前的是不会重复的。筛出的数都是 N=p1*p2的形式, p1,p2之间不相等
②如果 i 是合数,此时 i 可以表示成递增素数相乘 i=p1p2…*pn, pi都是素数(2<=i<=n), pi<=pj ( i<=j )
p1是最小的系数。
根据“关键处2”的定义,当p1==prime[j] 的时候,筛除就终止了,也就是说,只能筛出不大于p1的质数*i。
我们可以直观地举个例子。i=235
此时能筛除 2i ,不能筛除 3i
如果能筛除3i 的话,当 i’ 等于 i’=335 时,筛除2i’ 就和前面重复了。
需要证明的东西:
一个数会不会被重复筛除。
合数肯定会被干掉。
根据上面红字的条件,现在分析一个数会不会被重复筛除。
设这个数为 x=p1p2…*pn, pi都是素数(1<=i<=n) , pi<=pj ( i<=j )
当 i = 2 时,就是上面①的情况,
当 i >2 时, 就是上面②的情况, 对于 i ,第一个能满足筛除 x 的数 y 必然为 y=p2*p3…*pn(p2可以与p1相等或不等),而且满足条件的 y 有且只有一个。所以不会重复删除。
证明合数肯定会被干掉? 用归纳法吧。
类比一个模型,比如说我们要找出 n 中2个不同的数的所有组合 { i , j } ,1<=i<=n, 1<=j<=n,
我们会这么写
for (i=1; i<n; ++i )
for (j=i+1; j<=n; ++j)
{
}
我们取 j=i+1 便能保证组合不会重复。快速筛法大概也是这个道理,不过这里比较难理解,没那么直观。
以上完整源码(a.cpp)
/*
功能: 求[0, 20000)间的所有素数, 假设内存空间足够
环境: Linux C++
编译: g++ -o a a.cpp -Wall -Os
总结: 这两种算法在性能上差距不是很大, 当N个数较少时, 还是"一般线性筛选法"速度更快,
但是当N较大时, 快速线性筛选法的优势更加明显
*/
#include <stdio.h>
#include <string.h>
#define N 20000
// 一般线性筛选法: 会出现重复筛选同一个数
void make_prime(int primes[], int& cnt)
{
bool bPrime[N]; // 质数标志数组
cnt = 0; // 素数个数
memset(bPrime, true, sizeof(bPrime));// 假设全是素数
bPrime[0] = false; // 0: 非素数
bPrime[1] = false; // 1: 非素数
for (int i = 2; i < N; i++)
{
if (bPrime[i]) // i是素数
{
primes[cnt++] = i; // 将素数i保存到bPrimes[]中
// 作筛选: i的倍数都不是素数
for (int k = i * i; k < N; k += i) // 将素数i的倍数全置为非素数标志
bPrime[k] = false;
}
}
}
// 快速线性筛选法: 不会出现重复筛选同一个数
void getPrimes(int primes[], int& cnt)
{
bool bPrime[N]; // 素数标志数组
cnt = 0; // 素数个数
memset(bPrime, true, sizeof(bPrime)); // 假设全部为素数
bPrime[0] = false; // 0: 非素数
bPrime[1] = false; // 1: 非素数
for(int i = 2; i < N; i++)
{
if(bPrime[i]) // i是素数
primes[cnt++] = i; // 保存素数i
// 作筛选: i与素数的乘积都不是素数
for(int j = 0; j < cnt && i * primes[j] < N; j++)
{
bPrime[i * primes[j]] = false; // 置非素数标志
if(i % primes[j] == 0) // i为素数的倍数
break;
}
}
}
int main()
{
int primes[N]; // 保存所有素数
int cnt = 0; // 素数个数
#if 1
make_prime(primes, cnt); // 调用一般线性筛选法
#else
getPrimes(primes, cnt); // 调用快速线性筛选法
#endif
for(int i = 0; i < cnt; i++)
printf("primes[%d] = %d\n", i, primes[i]);
printf("\n素数个数cnt=%d\n", cnt);
return 0;
}
另一种奇数筛选法:
//偶数显然不行,所以先去掉偶数。可以看作上面第一种的优化吧。
//不过这种方法不太直观,不太好理解。
我推荐这个算法! 易于理解。 只算奇数部分,时空效率都还不错!
half=SIZE/2;
int sn = (int) sqrt(SIZE);
for (i = 0; i < half; i++)
p[i] = true;// 初始化全部奇数为素数。p[0]对应3,即p[i]对应2*i+3
for (i = 0; i < sn; i++) {
if(p[i])//如果 i+i+3 是素数
{
for(k=i+i+3, j=k*i+k+i; j < half; j+=k)
// 筛法起点是 p[i]所对应素数的平方 k^2
// k^2在 p 中的位置是 k*i+k+i
// 下标 i k*i+k+i
//对应数值 k=i+i+3 k^2
p[j]=false;
}
}
//素数都存放在 p 数组中,p[i]=true代表 i+i+2 是素数。
//举例,3是素数,按3*3,3*5,3*7...的次序筛选,因为只保存奇数,所以不用删3*4,3*6....