筛法求质数:埃氏筛,欧拉筛

文章介绍了判断[2,n]之间每个数是否为质数的方法,包括传统的试除法和更高效的埃氏筛法,其时间复杂度为O(nlogn)。进一步优化后的线性筛(欧拉筛)实现了O(n)的时间复杂度,确保每个数仅被其最小质因子筛选一次。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对于整数而言:

前言

如何判断[2,n]之间每个数是质数还是合数呢?
首先我们可以枚举每一个数,用试除法判断它是质数还是合数。时间复杂度O( n n n \sqrt n nn )。
事实上还有更好的做法。

埃氏筛求质数

我们枚举到每一个数x,就从二倍开始枚举它的所有倍数{2x,3x,…},标记它的倍数,它的倍数一定不是质数。
如果枚举到一个数x时,它还没被标记,证明它在[2,x-1]范围内没有约数,也即它是质数。

其中vis[i]==true,表示i为合数:
在这里插入图片描述

这就是朴素的埃氏筛法。
3大概有 n 3 \frac n 3 3n个倍数,4大概有 n 4 \frac n 4 4n个倍数,i大概有 n i \frac n i in个倍数。
每个数i都会枚举它的所有倍数,也就是枚举倍数次。
时间复杂度为O( ∑ i = 2 n n i \sum_{i=2}^n{\frac n i} i=2nin)。
∑ i = 2 n n i \sum_{i=2}^n{\frac n i} i=2nin是一个调和级数,约等于O( n ln ⁡ n n\ln n nlnn)=O( n log ⁡ e n n\log_e n nlogen)=O(nlogn)。
时间复杂度也就是O(nlogn)
时间复杂度带有log是因为,一些数字被重复标记了。

事实上可以优化:
我们注意到,每个合数n都可以表示为 p ⋅ k p \cdot k pk的形式,其中p是n的一个质因子。
那么我们优化,只枚举质数的倍数,然后标记它。
在这里插入图片描述
很容易证明,这样筛的时间复杂度是O( n ln ⁡ ln ⁡ n n\ln\ln n nlnlnn)=O(nloglogn)。

这个就是埃氏筛(埃拉托色尼筛法)。

额外提一嘴,我们注意到,同一个数的相同质因子只算一次的话。[1,n]中所有数的质因子数目之和为O(nloglogn)。
因为我们注意到,在埃氏筛的过程中,每个数都被它的每个不同质因子筛到一次。

线性筛(欧拉筛)

我们注意到,即使是优化了之后的埃氏筛法也有算重的地方,因为一个数被它的所有不同质因子到。
如果想要获得更好的时间复杂度,我们只需要强制每一个数只被它的其中一个质因子筛到一次。
最简单的一种写法是,我们只让一个数被它的最小质因子筛到一次。

const int N=100000000;
bool vis[N+5];
vector<int> a;
void Euler(int n) {
	for(int i=2;i<=n;i++) {
		if(!vis[i])
			a.push_back(i);
		for(auto&j:a) {
			int x=i*j;
			if(x>N) break;
			vis[x]=true;
			if(i%j==0) break;
		}
	}
}

我们指定i*j的最小质因子必须为j。

如果i%j=0,表示i中含有j这个因子,这意味着 i × j i \times j i×j本身的最小质因子还是j,筛 i × j i \times j i×j本身是合法的。
但是下一次循环,由于质数是从小到大被筛出来的,也就是说质数j是升序存储的,j会变大,此时 新的 i × j i \times j i×j 的最小质因子就是i的最小质因子(也就是原来的j)了,违反了我们的规定,因此退出循环。

每个数都仅被它的最小质因子筛到一次。时间复杂度O(n)。

后记

于是皆大欢喜。

<think>好的,我现在需要帮用户介绍一下素数筛法,特别是埃氏筛法和线性筛法,并且要给出C++代码。首先,用户可能是在学习算法或者数论相关内容,需要了解这两种筛法的原理、步骤以及代码实现。用户可能对它们的区别和各自的优缺点感兴趣,尤其是时间复杂度和效率方面。 首先,我应该回忆埃氏筛法的基本思想。埃拉托斯特尼筛法是通过不断标记素数的倍数来选出所有素数。它的时间复杂度是O(n log log n),对于一般的问题已经够用了,但可能会有重复标记的情况,比如数字6会被2和3都标记一次,导致效率稍低。 接下来是线性筛法,也就是欧拉。这种筛法的核心是每个合数只被它的最小质因数掉,这样每个合数只被标记一次,时间复杂度是O(n),但实现起来稍微复杂一些,需要维护一个质数列表,并且每次用当前质数去乘已经找到的质数,直到当前数能被该质数整除为止。 用户可能需要对比这两种方法的优缺点,比如埃氏筛法虽然时间复杂度稍高,但实现简单,适合小规模数据或者对代码简洁性要高的场景;而线性筛法在数据规模较大时更高效,但代码稍微复杂,需要更多的空间来存储质数列表。 接下来要考虑用户提供的C++代码示例。需要确保代码正确,并且有注释说明关键步骤。例如,埃氏筛法需要一个布尔数组isPrime,初始化为true,然后从2开始,将每个素数的倍数标记为false。而线性筛法需要维护一个vector存储素数,内层循环中,对于每个数i,用已有的素数prime[j]去标记i*prime[j],并且在i能整除prime[j]时跳出循环,避免重复标记。 还要注意代码的效率优化,比如埃氏筛法可以从i*i开始标记,因为之前的倍数已经被更小的素数标记过了。而线性筛法则必须确保每个合数只被一次,因此需要及时break。 用户可能的疑问包括:为什么线性筛法能保证每个合数只被一次?这时候需要解释,每个合数都是被其最小质因数掉的,比如12会被2掉(当i=6,prime[j]=2时),而不会在i=4,prime[j]=3的时候被,因为此时i%prime[j]等于0,会break,避免用更大的质数。 另外,可能需要说明这两种筛法的适用场景。例如,埃氏筛法适合需要快速实现且处理数据规模不是特别大的情况,而线性筛法在处理大规模数据时更高效,尤其是在n很大的时候。 最后,用户可能需要实际运行这些代码,所以需要确保代码的正确性,没有语法错误,并且给出测试示例,比如n=30时输出的素数列表是否正确。在代码示例中,最好也包含输入的提示和输出的格式,方便用户理解和使用。</think>以下是关于**素数筛法埃氏筛法与线性筛法)**的详细解析,包含C++代码实现: --- ### 一、埃拉托斯特尼筛法埃氏筛法) #### 核心思想 通过**标记素数的倍数**来选出所有素数,时间复杂度为$O(n \log \log n)$。 #### 步骤 1. 初始化一个布尔数组`isPrime[0..n]`,默认全为`true`。 2. 从最小的素数2开始,若`isPrime[i]`为`true`,则标记所有$i$的倍数为非素数。 3. 重复步骤2直到遍历完$\sqrt{n}$。 #### C++代码 ```cpp #include <iostream> #include <vector> using namespace std; void eratosthenes(int n) { vector<bool> isPrime(n + 1, true); isPrime[0] = isPrime[1] = false; // 0和1不是素数 for (int i = 2; i * i <= n; ++i) { if (isPrime[i]) { // 从i*i开始标记,因为更小的倍数已被更小的素数标记过 for (int j = i * i; j <= n; j += i) { isPrime[j] = false; } } } // 输出所有素数 for (int i = 2; i <= n; ++i) { if (isPrime[i]) cout << i << " "; } } int main() { int n = 30; cout << "埃氏筛法结果(n=30):"; eratosthenes(n); return 0; } ``` #### 输出 ``` 埃氏筛法结果(n=30):2 3 5 7 11 13 17 19 23 29 ``` --- ### 二、线性筛法欧拉筛法) #### 核心思想 确保每个合数**仅被其最小质因数除**,时间复杂度$O(n)$,空间复杂度$O(n)$。 #### 步骤 1. 维护一个质数列表`primes`和一个布尔数组`isPrime[0..n]`。 2. 遍历每个数$i$,若未被标记为非素数,则将其加入质数列表。 3. 用当前质数$p$标记$i \times p$为非素数,当$i \bmod p = 0$时终止标记。 #### C++代码 ```cpp #include <iostream> #include <vector> using namespace std; void eulerSieve(int n) { vector<bool> isPrime(n + 1, true); vector<int> primes; // 存储所有素数 isPrime[0] = isPrime[1] = false; for (int i = 2; i <= n; ++i) { if (isPrime[i]) { primes.push_back(i); // i是素数,加入列表 } // 用当前已知素数标记i*primes[j] for (int j = 0; j < primes.size() && i * primes[j] <= n; ++j) { isPrime[i * primes[j]] = false; if (i % primes[j] == 0) break; // 关键:保证只被最小质因数一次 } } // 输出结果 for (int p : primes) cout << p << " "; } int main() { int n = 30; cout << "线性筛法结果(n=30):"; eulerSieve(n); return 0; } ``` #### 输出 ``` 线性筛法结果(n=30):2 3 5 7 11 13 17 19 23 29 ``` --- ### 三、两种筛法的对比 | 特性 | 埃氏筛法 | 线性筛法 | |--------------------|---------------------------------|---------------------------------| | **时间复杂度** | $O(n \log \log n)$ | $O(n)$ | | **空间复杂度** | $O(n)$ | $O(n)$ | | **重复标记次数** | 较多(如6会被2和3各标记一次) | 无(每个合数仅被标记一次) | | **适用场景** | 小规模数据或快速实现 | 大规模数据或严格时间复杂度要 | --- ### 四、关键点解析 1. **埃氏筛法的优化**: - 标记起点从$i^2$开始,避免重复标记(如$i=5$时,直接从25开始标记,跳过10、15、20等已被标记的数)。 2. **线性筛法的核心**: - **`if (i % primes[j] == 0) break`**: 假设当前数为$i=4$,质数列表为$[2,3]$,当标记$4 \times 2=8$后,由于$4 \bmod 2=0$,停止标记,避免后续标记$4 \times 3=12$(12会被$6 \times 2=12$除,保证最小质因数优先)。 --- ### 五、实际应用 - **埃氏筛法**:适合一次性生成素数表(如LeetCode计数问题)。 - **线性筛法**:在需要频繁查询或处理极大范围(如$n \geq 10^7$)时更高效。 若有疑问(如代码细节或数学证明),欢迎进一步讨论!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值