Meissel-Lehmer算法
引入
首先引入一个问题。LibreOJ 6235:令 $\pi(n)$ 为 $n$ 以内的质数个数,求 $\pi(n)$ $(1 \leq n \leq 10^{11})$。
当然你可能会说你有分段打表的做法。众所周知,$1 \leq l \leq r \leq 10^{12}$ 且 $0 \leq r - l \leq 10^6$ 时,$[l, r]$ 中质数个数有一个很 trivial 的类似 Eratosthenes 筛的 $O((r - l)\log \log \sqrt r)$ 的做法。在这个基础上把 $[1, 10^{11}]$ 分成 $10^4$ 段,每段在本地预处理一下,段外的部分再单独算。这样分段打表确实可以卡过去,但是我们有不那么生草的做法:洲阁筛 min_25筛 Meissel-Lehmer 算法可以在 $O(n^{\frac23})$ 的时间复杂度内计算 $\pi(n)$。
这个算法在算法竞赛选手之间并不怎么普及(所以想写这篇文章),可能是因为实现起来确实略微有点麻烦(尤其是对不能抄板子的 OI 选手来说?)。虽然说 Miller-Rabin 素性判断和 Pollard-Rho 质因数分解也很麻烦,但也面对的场景大概也多一些,相比之下 Meissel-Lehmer 算法在算法竞赛生涯中可能遇不到几次(?)。目前见到的相关题目只有 2016 ICPC 沈阳赛区网络赛 J 和 2020 毛营 Day5 I,更生草的是可以看到后者的官方题解就是分段打表……大概进一步印证了这个算法的冷门……?
原理
令 $p_1, p_2, \dots, p_m$ 为前 $m$ 个质数。定义 $\phi(n, m)$ 为 $[1, n]$ 内所有质因子都大于 $p_m$ 的数的个数,$P_k(n, m)$ 为 $[1, n]$ 内恰有 $k$ 个大于 $p_m$ 的质因子的数的个数。 特别地,令 $P_0(n, m) = 1$,则有
$$
\phi(n, m) = P_0(n, m) + P_1(n, m) + \dots + P_k(n, m) + \dots
$$
注意到 $p_m^k > n$ 时有 $P_k(n, m) = 0$,所以,如果我们取 $x \in [n^{\frac13}, n^{\frac12}]$ 并令 $m = \pi(x)$,对于任意 $k \geq 3$,都有 $P_k(n, m) = 0$。即,
$$
\phi(n, m) = P_0(n, m) + P_1(n, m) + P_2(n, m)
$$
根据定义,显然 $P_1(n, m) = \pi(n) - m$,于是我们对上式适当变换,得
$$
\pi(n) = \phi(n, m) - P_2(n, m) + m - 1
$$
接下来,我们只需要计算 $\phi(n, m)$ 和 $P_2(n, m)$。根据定义,不难得到其计算方式如下:
$$
P_2(n, m) = \sum_{x < p \leq \sqrt n} (\pi(\frac np) - \pi(p) + 1)
$$
$$
\phi(n, m) =
\begin{cases}
[n], & m = 0 \
\phi(n, m - 1) - \phi(\frac {n}{p_m}, m - 1), & m \geq 1
\end{cases}
$$
复杂度分析
$P_2(n, m)$
对于 $x < p \leq \sqrt n$,显然有 $\frac np < \frac nx < n^{\frac 23}$,为了快速计算 $P_2(n, m)$,我们可以用线性筛 $O(n^\frac 23)$ 预处理 $[1, n^{\frac 23}]$ 内的质数,然后 $O(n^\frac 12)$ 进行累加。时间复杂度 $O(n^\frac 23)$,空间复杂度 $O(n^\frac 23)$。
如果这个空间复杂度无法接受,我们可以时间换空间,少预处理一些,对于较大的询问则令 $\pi(n)$ 和 $P_2(n, m)$ 相互调用。那么时空复杂度是多少,究竟应该预处理多少呢?下面那份网上找的板子预处理的范围是 $5 \times 10^6$,并且认为可以降到 $n^\frac 13$,我暂且没算明白……
$\phi(n, m)$
更算不明白了……这式子看上去挺慢的,然而又可以大力预处理大力剪枝(见板子),总之实际跑起来完全没问题。但很想知道时间复杂度怎么算……
代码
这是网上可以大量找到的一个 Meissel-Lehmer 的板子(看码风也知道不是我写的),想自己整一个,但是我太懒了。
1 | const int N = 5e6 + 2;//通过知道前面的n^1/3的质数可以推断后面n^2/3的质数所以可以适当减小 |
这个板子有一个比较有疑问的地方:有两个功能完全一样的函数 getpi
和 lehmer_pi
。很显然 getpi
就是我们上面介绍的方法,但 lehmer_pi
写的内容我完全没懂……看起来是传说中(?)Deleglise 和 Rivat 提出的 $O(\frac{n^\frac 23}{\log^2 n})$ 的优化(有兴趣可以看这篇论文)。如果真的是的话,只能说这个优化的常数也太大了——测试了各种数据范围,结论是这个 lehmer_pi
跑起来比 getpi
还要慢一些……如果要抄这个板子的话,还是直接忽略最后一段吧……