若一个正整数无法被除了1和它自身以外的任何自然数整除,则称该数为素数(Prime number),或称质数。
在整个自然数集合中,素数的数量不多,分布比较稀疏,对于一个足够大的整数N,不超过N的素数大约有[math]\displaystyle{ \frac{N}{\ln N} }[/math]个。
质数的判定
最简单的方法就是试除法,它作为最简单也最经典的确定性算法,是我们经常会使用的方法。
int is_prime(n) {
if (n < 2)
return 0;
for (int i = 2; i * i < n; ++i)
if (n % i == 0)
return 0;
return 1;
}
筛法
Eratosthenes筛法
给定一个整数N,求出1~N之间的所有素数,称为素数的筛选问题。
对于这类问题我们有一种选择是Eratosthenes筛法。
Eratosthenes筛法基于这样的想法:任意整数x的倍数2x,3x,...都不是素数。根据素数的定义,上述命题显然成立。
我们可以从2开始,由小到大扫描每个数x,把它的倍数标记为合数。当扫描到一个数时,若它没被标记,说明它不能被2~x-1之间的任何数整除,该数就是素数。
int v[MAX_N];
void eratosthenes(int n) {
memset(v, 0, sizeof(v));
for (int i = 2; i <= n; ++i) {
if (v[i])
continue;
for (int j = i; j <= n/i; ++i)
v[i * j] = 1;
}
}
Eratosthenes筛法的时间复杂度为[math]\displaystyle{ O(N \log \log N) }[/math],该算法实现简单,效率已经非常接近线性,是算法竞赛最常用的素数筛法。
线性筛
即使在优化后(从[math]\displaystyle{ x^2 }[/math]开始),Eratosthenes筛法仍然会重复标记合数。
线性筛法通过“从大到小累计素因数”的方式标记每个合数。
设数组v记录每个数的最小素因数,我们按照以下步骤维护v:
- 依次考虑2~N之间每个数i。
- 若v[i]=i,说明i是素数,把它保存起来。
- 扫描不大于v[i]的每个素数p,令v[i*p]=p。
每个合数i*p只会被它的最小素因数p筛一次,时间复杂度为[math]\displaystyle{ O(N) }[/math]。
int v[MAX_N], prime[MAX_N];
int m;
void primes(int n) {
memset(v, 0, sizeof(v));
m = 0;
for (int i = 2; i <= n; ++i) {
if (v[i] == 0) {
v[i] = i;
prime[++m] = i;
}
for (int j = 1; j <= m; ++j) {
if (prime[j] > v[i] || prime[j] > m/i)
break;
v[i * prime[j]] = prime[i];
}
}
}
参考资料
- 算法竞赛进阶指南,李煜东,134~137页