Label
利用欧拉函数性质普通莫比乌斯反演+对数论分块求和的筛法优化
Description
TTT组n(T,n≤5×105)n(T,n\leq5\times10^5)n(T,n≤5×105),求
∑i=1n∑j=in∑d∣gcd(i,j)ijgcd(id,jd)\sum_{i=1}^{n}\sum_{j=i}^{n}\sum_{d|gcd(i,j)}\frac{ij}{gcd(\frac{i}{d},\frac{j}{d})}i=1∑nj=i∑nd∣gcd(i,j)∑gcd(di,dj)ij
Solution
∑i=1n∑j=in∑d∣(i,j)ij(id,jd)\sum_{i=1}^{n}\sum_{j=i}^{n}\sum_{d|(i,j)}\frac{ij}{(\frac{i}{d},\frac{j}{d})}i=1∑nj=i∑nd∣(i,j)∑(di,dj)ij
=∑i=1n∑j=1i∑d∣(i,j)ij(id,jd)=\sum_{i=1}^{n}\sum_{j=1}^{i}\sum_{d|(i,j)}\frac{ij}{(\frac{i}{d},\frac{j}{d})}=i=1∑nj=1∑id∣(i,j)∑(di,dj)ij
(由于求和下界是变量的话,会涉及到奇奇怪怪的上取整,故此处作此变换)
=∑d=1n∑i=1n∑j=1i[d∣(i,j)]ij(id,jd)=\sum_{d=1}^{n}\sum_{i=1}^{n}\sum_{j=1}^{i}[d|(i,j)]\frac{ij}{(\frac{i}{d},\frac{j}{d})}=d=1∑ni=1∑nj=1∑i[d∣(i,j)](di,dj)ij
=∑d=1nd2∑i=1⌊nd⌋∑j=1iij(i,j)=\sum_{d=1}^{n}d^2\sum_{i=1}^{\lfloor\frac{n}{d}\rfloor}\sum_{j=1}^{i}\frac{ij}{(i,j)}=d=1∑nd2i=1∑⌊dn⌋j=1∑i(i,j)ij
=∑d=1nd2∑i=1⌊nd⌋∑j=1ilcm(j,i)(1)=\sum_{d=1}^{n}d^2\sum_{i=1}^{\lfloor\frac{n}{d}\rfloor}\sum_{j=1}^{i}lcm(j,i)(1)=d=1∑nd2i=1∑⌊dn⌋j=1∑ilcm(j,i)(1)
为了化简求和号,我们逐层化简:
∑i=1nlcm(i,n)\sum_{i=1}^{n}lcm(i,n)i=1∑nlcm(i,n)
(这个式子加上这个题的数据范围就是spoj5971 LCMSUM,但spoj目前交不了题,故将此题推导过程顺便放在此处)
=∑i=1nni(i,n)=n∑d=1n1d∑i=1ni[(i,n)=d]=\sum_{i=1}^{n}\frac{ni}{(i,n)}=n\sum_{d=1}^{n}\frac{1}{d}\sum_{i=1}^{n}i[(i,n)=d]=i=1∑n(i,n)ni=nd=1∑nd1i=1∑ni[(i,n)=d]
=n∑d∣n∑i=1ndi[(i,nd)=1]=n∑d∣n∑i=1di[(i,d)=1]=n\sum_{d|n}\sum_{i=1}^{\frac{n}{d}}i[(i,\frac{n}{d})=1]=n\sum_{d|n}\sum_{i=1}^{d}i[(i,d)=1]=nd∣n∑i=1∑dni[(i,dn)=1]=nd∣n∑i=1∑di[(i,d)=1]
由于欧拉函数的一个经典性质:∑i=1ni[(i,n)=1]=nφ(n)+[n=1]2\sum_{i=1}^{n}i[(i,n)=1]=\frac{n\varphi(n)+[n=1]}{2}∑i=1ni[(i,n)=1]=2nφ(n)+[n=1],故:
n∑d∣n∑i=1di[(i,d)=1]=n∑d∣ndφ(d)+[d=1]2=n(12+∑d∣ndφ(d)2)n\sum_{d|n}\sum_{i=1}^{d}i[(i,d)=1]=n\sum_{d|n}\frac{d\varphi(d)+[d=1]}{2}=n(\frac{1}{2}+\sum_{d|n}\frac{d\varphi(d)}{2})nd∣n∑i=1∑di[(i,d)=1]=nd∣n∑2dφ(d)+[d=1]=n(21+d∣n∑2dφ(d))
=n(1+∑d∣ndφ(d))2=\frac{n(1+\sum_{d|n}d\varphi(d))}{2}=2n(1+∑d∣ndφ(d))
设g(n)=∑d∣ndφ(d),f(n)=∑i=1nlcm(i,n),S(n)=∑i=1nf(i)g(n)=\sum_{d|n}d\varphi(d),f(n)=\sum_{i=1}^{n}lcm(i,n),S(n)=\sum_{i=1}^{n}f(i)g(n)=∑d∣ndφ(d),f(n)=∑i=1nlcm(i,n),S(n)=∑i=1nf(i),则:
f(n)=n(1+g(n))2f(n)=\frac{n(1+g(n))}{2}f(n)=2n(1+g(n))
(1)=∑d=1nd2∑i=1⌊nd⌋f(i)=∑d=1nd2S(⌊nd⌋)(1)=\sum_{d=1}^{n}d^2\sum_{i=1}^{\lfloor\frac{n}{d}\rfloor}f(i)=\sum_{d=1}^{n}d^2S(\lfloor\frac{n}{d}\rfloor)(1)=d=1∑nd2i=1∑⌊dn⌋f(i)=d=1∑nd2S(⌊dn⌋)
由于g(n)g(n)g(n)也是积性函数,故g(n)g(n)g(n)既可以通过枚举ddd从而O(nlogn)O(nlogn)O(nlogn)求出,也可以利用线性筛O(n)O(n)O(n)求出(如何O(n)O(n)O(n)求出:推导过程较麻烦,见另文)。
由于求出g(1)∼g(n)g(1)\sim g(n)g(1)∼g(n)后,我们可以O(n)O(n)O(n)预处理出f(1)∼f(n)f(1)\sim f(n)f(1)∼f(n)与s(1)∼s(n)s(1)\sim s(n)s(1)∼s(n),故(1)(1)(1)式的取值集合可以通过数论分块O(nn)O(n\sqrt n)O(nn)求出,总时间复杂度为O(nn+nlogn)O(n\sqrt n+nlogn)O(nn+nlogn),对于5e55e55e5的数据规模来讲会TLE,考虑优化。
对于(1)(1)(1)式ans(n)=∑d=1nd2S(⌊nd⌋)ans(n)=\sum_{d=1}^{n}d^2S(\lfloor\frac{n}{d}\rfloor)ans(n)=∑d=1nd2S(⌊dn⌋),我们仍然枚举ddd,考虑每一个ddd可能对ansansans表的哪些值有贡献:我们在枚举ddd的同时枚举所有可能的⌊nd⌋\lfloor\frac{n}{d}\rfloor⌊dn⌋的取值iii,显然应有id≤maxnid\leq max{n}id≤maxn,此时满足⌊nd⌋=i\lfloor\frac{n}{d}\rfloor=i⌊dn⌋=i的nnn的取值显然为[id,(i+1)d)[id,(i+1)d)[id,(i+1)d)。所以,对于任意的ddd和对应的任意iii,ddd对于ans(id)∼ans((i+1)d−1)ans(id)\sim ans((i+1)d-1)ans(id)∼ans((i+1)d−1)的值会有d2S(i)d^2S(i)d2S(i)的贡献。
枚举ddd与i(id≤maxn)i(id\leq max{n})i(id≤maxn)的时间复杂度为O(nlogn)O(nlogn)O(nlogn),而由于每对d,id,id,i对ans表的贡献是对连续区间的值的贡献,相当于区间加操作。由于我们执行O(nlogn)O(nlogn)O(nlogn)次区间加操作但中间过程中并不需要查询ans(i)ans(i)ans(i)的值,故我们利用差分数组维护该操作即可。
算法时间总复杂度:O(nlogn)O(nlogn)O(nlogn)
Code
#include<cstdio>
#include<cmath>
#include<iostream>
#define ri register int
#define ll long long
using namespace std;
const int MAXN=5e5+20;
int T,prime[MAXN],cnt,q[MAXN],N;
ll phi[MAXN],f[MAXN],g[MAXN],ans[MAXN];
bool vis[MAXN];
void EulaSieve(int n)
{
phi[1]=1,vis[1]=true;
for(ri i=2;i<=n;++i)
{
if(!vis[i]) prime[++cnt]=i,phi[i]=(ll)i-1;
for(ri j=1;j<=cnt&&i*prime[j]<=n;++j)
{
vis[i*prime[j]]=true;
if(i%prime[j]==0) phi[i*prime[j]]=phi[i]*(ll)prime[j];
else phi[i*prime[j]]=phi[i]*phi[prime[j]];
if(i%prime[j]==0) break;
}
}
}
void EratSieve(int n)
{
for(ri i=1;i<=n;++i)
for(ri j=i;j<=n;j+=i)
g[j]+=(ll)i*phi[i];
for(ri i=1;i<=n;++i)
f[i]=(ll)i*(g[i]+1)/2LL,f[i]=f[i-1]+f[i];
for(ri d=1;d<=n;++d)
for(ri i=1;i*d<=n;++i)
{
ri sj=(i+1)*d;
if(sj>n) sj=n+1;
ans[i*d]+=(ll)d*(ll)d*f[i],ans[sj]-=(ll)d*(ll)d*f[i];
}
for(ri i=1;i<=n;++i)
ans[i]=ans[i]+ans[i-1];
}
int main()
{
std::ios::sync_with_stdio(false);
cin>>T;
for(ri i=1;i<=T;++i)
{
cin>>q[i];
N=max(q[i],N);
}
EulaSieve(N),EratSieve(N);
for(ri i=1;i<=T;++i)
cout<<"Case #"<<i<<": "<<(unsigned int)ans[q[i]]<<'\n';
return 0;
}
本文介绍了一种利用欧拉函数性质和莫比乌斯反演的优化策略,针对特定问题∑i=1n∑j=in∑d|gcd(i,j)ijgcd(id,jd)的求解,通过对数论分块求和和筛法技巧,将时间复杂度降低到O(n√n+nlogn),适用于大规模数据处理,如Spoj 5971 LCMSUM问题.
1107





