莫比乌斯反演初探
1. 莫比乌斯函数的定义
首先将正整数x写成分解形式:
x = p 1 α 1 ∗ p 2 α 2 ∗ . . . ∗ p k α k x=p_1^{\alpha_1}*p_2^{\alpha_2}*...*p_k^{\alpha_k} x=p1α1∗p2α2∗...∗pkαk
则莫比乌斯函数定义为:
μ ( x ) = { 1 , x = 1 0 , ∃ α i ≥ 2 ( − 1 ) k , ∀ α i = 1 其中 k 是 x 包含的不同质因子的个数 \mu(x)=\begin{cases} 1, &x=1\\ 0, &\exists \alpha_i \geq2 \\ (-1)^k, &\forall \alpha_i =1 \end{cases} \qquad \text{ 其中 k 是 x 包含的不同质因子的个数} μ(x)=⎩⎪⎨⎪⎧1,0,(−1)k,x=1∃αi≥2∀αi=1 其中 k 是 x 包含的不同质因子的个数
例如:
μ
(
6
)
=
1
,
μ
(
7
)
=
−
1
,
μ
(
8
)
=
0
,
μ
(
p
)
=
−
1
(
p
为
质
数
)
\mu(6)=1,\quad\quad\mu(7)=-1,\quad\quad\mu(8)=0,\quad\mu(p)=-1(p为质数)
μ(6)=1,μ(7)=−1,μ(8)=0,μ(p)=−1(p为质数)
2. S(x)函数
我们定义:
S ( x ) = ∑ d ∣ x μ ( d ) S(x)=\sum_{d|x}\mu(d) S(x)=d∣x∑μ(d)
则:
S ( x ) = { 1 , x = 1 0 , x > 1 = [ x = 1 ] S(x)=\begin{cases} 1, &x=1\\ 0, &x>1 \end{cases} =[x=1] S(x)={1,0,x=1x>1=[x=1]
证明如下:
当x=1时:
S ( x ) = S ( 1 ) = μ ( 1 ) = 1 S(x)=S(1)=\mu(1)=1 S(x)=S(1)=μ(1)=1
当x>1时:
因 为 x = p 1 α 1 ∗ p 2 α 2 ∗ . . . ∗ p k α k , 故 x 的 约 数 d = p 1 β 1 ∗ p 2 β 2 ∗ . . . ∗ p k β k ( 其 中 0 ≤ β i ≤ α i ) 若 ∃ β i ≥ 2 , 则 μ ( x ) = 0 ; 故 我 们 只 需 要 考 虑 β i 取 1 和 0 的 情 况 , 即 考 虑 k 个 β i 中 有 多 少 个 β i 取 1 , 显 然 , 可 能 有 0 个 β i 取 1 , 1 个 β i 取 1 , . . . , k 个 β i 取 1 , 则 S ( x ) = μ ( d 0 ) + μ ( d 1 ) + μ ( d 2 ) + . . . + μ ( d k ) = C k 0 ( − 1 ) 0 + C k 1 ( − 1 ) 1 + . . . + C k k ( − 1 ) k = ( − 1 + 1 ) k = 0 因为x=p_1^{\alpha_1}*p_2^{\alpha_2}*...*p_k^{\alpha_k},故x的约数d=p_1^{\beta_1}*p_2^{\beta_2}*...*p_k^{\beta_k}(其中0 \leq \beta_i \leq \alpha_i)\\ 若 \exists \beta_i\geq2,则\mu(x)=0;\\ 故我们只需要考虑\beta_i取1和0的情况,即考虑k个\beta_i中有多少个\beta_i取1,\\ 显然,可能有0个\beta_i取1,1个\beta_i取1,...,k个\beta_i取1,\\ \begin{aligned}则S(x) &=\mu(d_0)+\mu(d_1)+\mu(d_2)+...+\mu(d_k)\\ &=C_k^0 (-1)^0+C_k^1(-1)^1+...+C_k^k(-1)^k\\&=(-1+1)^k\\&=0\end{aligned} 因为x=p1α1∗p2α2∗...∗pkαk,故x的约数d=p1β1∗p2β2∗...∗pkβk(其中0≤βi≤αi)若∃βi≥2,则μ(x)=0;故我们只需要考虑βi取1和0的情况,即考虑k个βi中有多少个βi取1,显然,可能有0个βi取1,1个βi取1,...,k个βi取1,则S(x)=μ(d0)+μ(d1)+μ(d2)+...+μ(dk)=Ck0(−1)0+Ck1(−1)1+...+Ckk(−1)k=(−1+1)k=0
3. 莫比乌斯反演定理
定 理 一 : 若 F ( n ) = ∑ d ∣ n f ( d ) , 则 f ( n ) = ∑ d ∣ n μ ( d ) F ( n d ) 定理一:\qquad若F(n)=\sum_{d|n}f(d),则f(n)=\sum_{d|n}\mu(d)F(\frac{n}{d}) 定理一:若F(n)=d∣n∑f(d),则f(n)=d∣n∑μ(d)F(dn)
定 理 二 : 若 F ( n ) = ∑ n ∣ d f ( d ) , 则 f ( n ) = ∑ n ∣ d μ ( d n ) F ( d ) 定理二:\qquad若F(n)=\sum_{n|d}f(d),则f(n)=\sum_{n|d}\mu(\frac{d}{n})F(d) 定理二:若F(n)=n∣d∑f(d),则f(n)=n∣d∑μ(nd)F(d)
第一个定理的证明:
∑ d ∣ n μ ( d ) F ( n d ) = ∑ d ∣ n μ ( d ) ∑ i ∣ n d f ( i ) = ∑ i ∣ n f ( i ) ∑ d ∣ n i μ ( d ) = ∑ i ∣ n f ( i ) S ( n i ) = f ( i ) \begin{aligned} \sum_{d|n}\mu(d)F(\frac{n}{d})&=\sum_{d|n}\mu(d)\sum_{i|{\frac{n}{d}}}f(i)\\ &=\sum_{i|n}f(i)\sum_{d|\frac{n}{i}}\mu(d)\\ &=\sum_{i|n}f(i)S(\frac{n}{i})\\ &=f(i) \end{aligned} d∣n∑μ(d)F(dn)=d∣n∑μ(d)i∣dn∑f(i)=i∣n∑f(i)d∣in∑μ(d)=i∣n∑f(i)S(in)=f(i)
推导过程:
由 F ( n ) 的 定 义 F ( n ) = ∑ d ∣ n f ( d ) , 代 入 得 ∑ d ∣ n μ ( d ) F ( n d ) = ∑ d ∣ n μ ( d ) ∑ i ∣ n d f ( i ) , 由 于 i ∣ n d , 所 以 i d ∣ n , 由 于 d ∣ n 且 i ∣ n , 所 以 d ∣ n i , 交 换 累 加 次 序 得 ∑ i ∣ n f ( i ) ∑ d ∣ n i μ ( d ) , 最 后 的 ∑ d ∣ n i μ ( d ) 就 是 上 面 的 S ( n i ) , 故 式 子 可 以 变 换 为 ∑ i ∣ n f ( i ) S ( n i ) = ∑ i ∣ n f ( i ) [ n i = 1 ] = ∑ i ∣ n f ( i ) [ i = n ] = f ( n ) 由F(n)的定义F(n)=\sum_{d|n}f(d),代入得\sum_{d|n}\mu(d)F(\frac{n}{d})=\sum_{d|n}\mu(d)\sum_{i|{\frac{n}{d}}}f(i),\\ 由于i|\frac{n}{d},所以id|n,由于d|n且i|n,所以d|\frac{n}{i},交换累加次序得\sum_{i|n}f(i)\sum_{d|\frac{n}{i}}\mu(d),\\ 最后的\sum_{d|\frac{n}{i}}\mu(d)就是上面的S(\frac{n}{i}),\\ 故式子可以变换为\sum_{i|n}f(i)S(\frac{n}{i})=\sum_{i|n}f(i)[\frac{n}{i}=1]=\sum_{i|n}f(i)[i=n]=f(n) \\ 由F(n)的定义F(n)=d∣n∑f(d),代入得d∣n∑μ(d)F(dn)=d∣n∑μ(d)i∣dn∑f(i),由于i∣dn,所以id∣n,由于d∣n且i∣n,所以d∣in,交换累加次序得i∣n∑f(i)d∣in∑μ(d),最后的d∣in∑μ(d)就是上面的S(in),故式子可以变换为i∣n∑f(i)S(in)=i∣n∑f(i)[in=1]=i∣n∑f(i)[i=n]=f(n)
第二个定理的证明:
∑ n ∣ d μ ( d n ) F ( d ) = ∑ n ∣ d μ ( d n ) ∑ d ∣ i f ( i ) = ∑ n ∣ i f ( i ) ∑ d ∣ i μ ( d n ) = ∑ n ∣ i f ( i ) ∑ n d ′ ∣ i μ ( d ′ ) = ∑ n ∣ i f ( i ) ∑ d ′ ∣ i n μ ( d ′ ) = ∑ n ∣ i f ( i ) S ( i n ) = f ( n ) \begin{aligned} \sum_{n|d}\mu(\frac{d}{n})F(d)&=\sum_{n|d}\mu(\frac{d}{n})\sum_{d|i}f(i)\\ &=\sum_{n|i}f(i)\sum_{d|i}\mu(\frac{d}{n})\\ &=\sum_{n|i}f(i)\sum_{nd'|i}\mu(d')\\ &=\sum_{n|i}f(i)\sum_{d'|\frac{i}{n}}\mu(d')\\ &=\sum_{n|i}f(i)S(\frac{i}{n})\\ &=f(n) \end{aligned} n∣d∑μ(nd)F(d)=n∣d∑μ(nd)d∣i∑f(i)=n∣i∑f(i)d∣i∑μ(nd)=n∣i∑f(i)nd′∣i∑μ(d′)=n∣i∑f(i)d′∣ni∑μ(d′)=n∣i∑f(i)S(ni)=f(n)
推导过程与上一个定理的推导过程相似,这边就不再赘述。
4. 莫比乌斯反演的应用
莫比乌斯反演是数论中的重要内容。对于一些函数 f ( n ) f(n) f(n) ,如果很难直接求出它的值,而容易求出其倍数和或约数和 F ( n ) F(n) F(n) ,那么可以通过莫比乌斯反演简化运算,求出的 f ( n ) f(n) f(n) 值。莫比乌斯反演题一般会用到整除分块
先来题直接套公式的 : P3455 [POI2007]ZAP-Queries
密码学家正在尝试破解一种叫 BSA 的密码。
他发现,在破解一条消息的同时,他还需要回答这样一种问题:
给出 a , b , d a,b,d a,b,d 求满足 1 ≤ x ≤ a , 1 ≤ y ≤ b 1 \leq x \leq a , 1 \leq y \leq b 1≤x≤a,1≤y≤b ,且 g c d ( x , y ) = d gcd(x,y)=d gcd(x,y)=d 的二元组 ( x , y ) (x,y) (x,y) 的数量。
因为要解决的问题实在太多了,他便过来寻求你的帮助。
数据范围 : 1 ≤ n ≤ 5 ∗ 1 0 4 1\leq n \leq 5*10^4 1≤n≤5∗104 , 1 ≤ d ≤ a , b ≤ 5 ∗ 1 0 4 1\leq d\leq a,b\leq 5*10^4 1≤d≤a,b≤5∗104
解题思路
-
很明显,该题要求的答案是
∑ x = 1 a ∑ y = 1 b [ g c d ( x , y ) = d ] \sum_{x=1}^{a}\sum_{y=1}^{b}[gcd(x,y)=d] x=1∑ay=1∑b[gcd(x,y)=d] -
那么我们设
f ( d ) = ∑ x = 1 a ∑ y = 1 b [ g c d ( x , y ) = d ] f(d)=\sum_{x=1}^{a}\sum_{y=1}^{b}[gcd(x,y)=d] f(d)=x=1∑ay=1∑b[gcd(x,y)=d] -
则 f ( d ) f(d) f(d) 就是我们要求的答案
-
设
F ( n ) = ∑ n ∣ k f ( k ) = ⌊ a n ⌋ ∗ ⌊ b n ⌋ F(n)=\sum_{n|k}f(k)=\lfloor \frac{a}{n} \rfloor *\lfloor \frac{b}{n} \rfloor F(n)=n∣k∑f(k)=⌊na⌋∗⌊nb⌋ -
则由莫比乌斯反演定理可以推出
f ( n ) = ∑ n ∣ k μ ( k n ) F ( k ) f(n)=\sum_{n|k}\mu(\frac{k}{n})F(k) f(n)=n∣k∑μ(nk)F(k) -
然后开始推…
f ( d ) = ∑ d ∣ k μ ( k d ) F ( k ) = ∑ d ∣ k μ ( k d ) ⌊ a k ⌋ ⌊ b k ⌋ = ∑ t = 1 m i n ( a , b ) μ ( t ) ⌊ a t d ⌋ ⌊ b t d ⌋ \begin{aligned} f(d)&=\sum_{d|k}\mu(\frac{k}{d})F(k)\\&=\sum_{d|k}\mu(\frac{k}{d})\lfloor \frac{a}{k} \rfloor \lfloor \frac{b}{k} \rfloor \\ &=\sum_{t=1}^{min(a,b)}\mu(t) \lfloor \frac{a}{td} \rfloor \lfloor \frac{b}{td} \rfloor \end{aligned} f(d)=d∣k∑μ(dk)F(k)=d∣k∑μ(dk)⌊ka⌋⌊kb⌋=t=1∑min(a,b)μ(t)⌊tda⌋⌊tdb⌋ -
该式子中a,b,d已知,线性筛法预处理 μ ( x ) \mu(x) μ(x) , 利用整除分块快速计算 ⌊ a t d ⌋ ⌊ b t d ⌋ \lfloor \frac{a}{td} \rfloor \lfloor \frac{b}{td} \rfloor ⌊tda⌋⌊tdb⌋
-
时间复杂度 O ( T ∗ n ) O(T*\sqrt n ) O(T∗n)
-
参考代码 :
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
typedef long long ll;
const int N = 5e4+5;
int mu[N],sum[N],prime[N],cnt;
bool st[N];
void init(){
mu[1]=1;
for(int i=2;i<N;i++){
if(!st[i]) prime[cnt++]=i,mu[i]=-1;
for(int j=0;prime[j]*i<N;j++){
st[prime[j]*i]=1;
if(i%prime[j]==0) break;
mu[prime[j]*i]=-mu[i];
}
}
for(int i=1;i<N;i++) sum[i]=sum[i-1]+mu[i];
}
ll f(int a,int b,int k){
a=a/k;
b=b/k;
ll res=0;
int n=min(a,b);
for(int l=1,r;l<=n;l=r+1){
r=min({n,a/(a/l),b/(b/l)});
res+=(ll)(sum[r]-sum[l-1])*(a/l)*(b/l);
}
return res;
}
int main(){
init();
int _;scanf("%d",&_);
while(_--){
int a,b,c,d,k;
scanf("%d%d%d",&a,&b,&k);
printf("%lld\n",f(a,b,k));
}
return 0;
}
再来一道个人觉得很好的题
今天的数学课上,Crash 小朋友学习了最小公倍数(Least Common Multiple)。对于两个正整数 a a a 和 b b b, l c m ( a , b ) lcm(a,b) lcm(a,b)和 b b b 的最小正整数。例如, l c m ( 6 , 8 ) = 24 lcm(6,8)=24 lcm(6,8)=24。
回到家后,Crash 还在想着课上学的东西,为了研究最小公倍数,他画了一张 n ∗ m n*m n∗m 的表格。每个格子里写了一个数字,其中第 i i i 行第 j j j 列的那个格子里写着数为 l c m ( i , j ) lcm(i,j) lcm(i,j)。
看着这个表格,Crash 想到了很多可以思考的问题。不过他最想解决的问题却是一个十分简单的问题:这个表格中所有数的和是多少。当 n n n 和 m m m 很大时,Crash 就束手无策了,因此他找到了聪明的你用程序帮他解决这个问题。由于最终结果可能会很大,Crash 只想知道表格里所有数的和 m o d 20101009 mod20101009 mod20101009 值。
数据范围 : 1 ≤ n , m ≤ 1 0 7 1\leq n,m\leq 10^7 1≤n,m≤107
解题思路 :
-
显然,我们要求的是这个式子
∑ i = 1 n ∑ j = 1 m l c m ( i , j ) \sum_{i=1}^n \sum_{j=1}^m lcm(i,j) i=1∑nj=1∑mlcm(i,j) -
利用最小公倍数和最大公约数的性质可以转化为
∑ i = 1 n ∑ j = 1 m i ∗ j g c d ( i , j ) \sum_{i=1}^n \sum_{j=1}^m \frac{i*j}{gcd(i,j)} i=1∑nj=1∑mgcd(i,j)i∗j -
用 d d d 表示 g c d ( i , j ) gcd(i,j) gcd(i,j)
∑ i = 1 n ∑ j = 1 m [ g c d ( i , j ) = d ] i ∗ j d \sum_{i=1}^n \sum_{j=1}^m [gcd(i,j)=d]\frac{i*j}{d} i=1∑nj=1∑m[gcd(i,j)=d]di∗j -
枚举 d d d , 并用 i ′ i' i′ 替代 i d \frac{i}{d} di ,替代后把 i ′ i' i′ 换回 i i i 得
∑ d = 1 m i n ( n , m ) d ∑ i = 1 ⌊ n d ⌋ ∑ j = 1 ⌊ m d ⌋ [ g c d ( i , j ) = 1 ] i ∗ j \sum_{d=1}^{min(n,m)}d \sum_{i=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{j=1}^{\lfloor \frac{m}{d} \rfloor} [gcd(i,j)=1]i*j d=1∑min(n,m)di=1∑⌊dn⌋j=1∑⌊dm⌋[gcd(i,j)=1]i∗j -
利用 S ( x ) = ∑ d ∣ x μ ( d ) = [ n = 1 ] S(x)=\sum_{d|x}\mu(d)=[n=1] S(x)=∑d∣xμ(d)=[n=1] ,带入得
∑ d = 1 m i n ( n , m ) d ∑ i = 1 ⌊ n d ⌋ ∑ j = 1 ⌊ m d ⌋ ∑ x ∣ g c d ( i , j ) μ ( x ) i ∗ j \sum_{d=1}^{min(n,m)}d \sum_{i=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{j=1}^{\lfloor \frac{m}{d} \rfloor} \sum_{x|gcd(i,j)} \mu(x) i*j d=1∑min(n,m)di=1∑⌊dn⌋j=1∑⌊dm⌋x∣gcd(i,j)∑μ(x)i∗j -
枚举 x x x
∑ d = 1 m i n ( n , m ) d ∑ i = 1 ⌊ n d ⌋ ∑ j = 1 ⌊ m d ⌋ ∑ x = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( x ) i ∗ j [ x ∣ g c d ( i , j ) ] \sum_{d=1}^{min(n,m)}d \sum_{i=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{j=1}^{\lfloor \frac{m}{d} \rfloor} \sum_{x=1}^{min(\lfloor \frac{n}{d} \rfloor,\lfloor \frac{m}{d} \rfloor)} \mu(x) i*j [x|gcd(i,j)] d=1∑min(n,m)di=1∑⌊dn⌋j=1∑⌊dm⌋x=1∑min(⌊dn⌋,⌊dm⌋)μ(x)i∗j[x∣gcd(i,j)] -
因为 x ∣ g c d ( i , j ) x|gcd(i,j) x∣gcd(i,j) , 设 i = u x , j = v x i=ux,j=vx i=ux,j=vx , 则
∑ d = 1 m i n ( n , m ) d ∑ x = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( x ) ∑ u x = 1 ⌊ n d ⌋ ∑ v x = 1 ⌊ m d ⌋ u v x 2 \sum_{d=1}^{min(n,m)}d \sum_{x=1}^{min(\lfloor \frac{n}{d} \rfloor,\lfloor \frac{m}{d} \rfloor)} \mu(x) \sum_{ux=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{vx=1}^{\lfloor \frac{m}{d} \rfloor} uvx^2 d=1∑min(n,m)dx=1∑min(⌊dn⌋,⌊dm⌋)μ(x)ux=1∑⌊dn⌋vx=1∑⌊dm⌋uvx2 -
整理一下
∑ d = 1 m i n ( n , m ) d ∑ x = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) x 2 μ ( x ) ( ∑ u = 1 ⌊ n d x ⌋ u ) ( ∑ v = 1 ⌊ m d x ⌋ v ) \sum_{d=1}^{min(n,m)}d \sum_{x=1}^{min(\lfloor \frac{n}{d} \rfloor,\lfloor \frac{m}{d} \rfloor)} x^2\mu(x) (\sum_{u=1}^{\lfloor \frac{n}{dx} \rfloor} u) (\sum_{v=1}^{\lfloor \frac{m}{dx} \rfloor}v) d=1∑min(n,m)dx=1∑min(⌊dn⌋,⌊dm⌋)x2μ(x)(u=1∑⌊dxn⌋u)(v=1∑⌊dxm⌋v) -
可以发现后面是一个等差数列前 n n n 项和公式
-
参考代码
#include<iostream>
using namespace std;
typedef long long ll;
const int N=1e7+5;
const ll mod=20101009;
int mu[N],sum[N],cnt,prime[N];
bool vis[N];
void init(){
mu[1]=1;
for(int i=2;i<N;i++){
if(!vis[i]) prime[cnt++]=i,mu[i]=-1;
for(int j=0;prime[j]*i<N;j++){
vis[prime[j]*i]=1;
if(i%prime[j]==0) break;
mu[prime[j]*i]=-mu[i];
}
}
for(int i=1;i<N;i++) sum[i]=(sum[i-1]+(ll)i*i%mod*(mu[i]+mod))%mod;
}
ll Sum(int x,int y){
return ((ll)x*(x+1)/2%mod)*((ll)y*(y+1)/2%mod)%mod;
}
ll f(int x,int y){
ll res=0;
for(int l=1,r;l<=min(x,y);l=r+1){
r=min(x/(x/l),y/(y/l));
res=(res+(ll)(sum[r]-sum[l-1]+mod)*Sum(x/l,y/l)%mod)%mod;
}
return res;
}
int main(){
init();
int n,m;
cin>>n>>m;
ll ans=0;
for(int l=1,r;l<=min(n,m);l=r+1){
r=min(n/(n/l),m/(m/l));
ans=(ans+(ll)(r-l+1)*(l+r)/2%mod*f(n/l,m/l)%mod)%mod;
}
cout<<ans;
return 0;
}