题目和标签都是假的。
题目大意:给定p, k, np, k, n,求:
(∑ni=11i)mod pk(∑i=1n1i)mod pk
保证有解,pkn≤1018, p≤105pkn≤1018, p≤105,pp是奇素数。
例如,当的时候,尽管1313和1616都没有意义,但是他们的和是1212,就可以计算。
题解:来一波充斥着神奇的推导。
f(n,k)=(∑i=1n1i)mod pkf(n,k)=(∑i=1n1i)mod pk
g(n,k)=(∑i=1,i mod p≠0n1i)mod pkg(n,k)=(∑i=1,i mod p≠0n1i)mod pk
显然有:
f(n,k)=⎛⎝⎜g(n,k)+f(⌊np⌋,k+1)p⎞⎠⎟mod pkf(n,k)=(g(n,k)+f(⌊np⌋,k+1)p)mod pk
考虑g怎么求:
g(n,k)=(∑i=1,i mod p≠0n1i)mod pkg(n,k)=(∑i=1,i mod p≠0n1i)mod pk
我们假定i=bp+a, a∈[1,p)i=bp+a, a∈[1,p)
g(n,k)=⎛⎝⎜⎜∑a=1p−1∑b=0⌊n−ap⌋1a+bp⎞⎠⎟⎟mod pkg(n,k)=(∑a=1p−1∑b=0⌊n−ap⌋1a+bp)mod pk
g(n,k)=⎛⎝⎜⎜∑a=1p−11a∑b=0⌊n−ap⌋11+bpa⎞⎠⎟⎟mod pkg(n,k)=(∑a=1p−11a∑b=0⌊n−ap⌋11+bpa)mod pk
我们注意到:
11−z=∑izi11−z=∑izi
那么令
z=−bpaz=−bpa
并代入上式,得到:
g(n,k)=⎛⎝⎜⎜∑a=1p−11a∑b=0⌊n−ap⌋∑i=0k−1(−bpa)i⎞⎠⎟⎟mod pkg(n,k)=(∑a=1p−11a∑b=0⌊n−ap⌋∑i=0k−1(−bpa)i)mod pk
这里内层的ii之所以枚举到是由于当k≤ik≤i时在对pkpk取模结果是0。
继续化简,将ii放到外层枚举:
g(n,k)=(∑i=0k−1(−p)i∑a=1p−11ai+1Si(⌊n−ap⌋))mod pkg(n,k)=(∑i=0k−1(−p)i∑a=1p−11ai+1Si(⌊n−ap⌋))mod pk
其中Sk(n)Sk(n)表示从0到n的k次幂和,我们推导这个。注意到因为a∈(0,p)a∈(0,p)所以⌊n−ap⌋⌊n−ap⌋最小值和最大值之差不会超过1。
我们知道xk––xk_可以用带符号第一类斯特林数展开,即:
xk––=∑i=1ks(k,i)xixk_=∑i=1ks(k,i)xi
那么我们把i=ki=k的那一项单独拿出来,就会知道:
xk=xk––−∑i=1k−1s(k,i)xixk=xk_−∑i=1k−1s(k,i)xi
因此:
Sk(n)=∑x=0nxk=∑x=0n(xk––−∑i=1k−1s(k,i)xi)Sk(n)=∑x=0nxk=∑x=0n(xk_−∑i=1k−1s(k,i)xi)
我们注意到:
∑x=0nxk––=∑x=0n(xk)k!=1k!∑x=kn(xk)=1k!(n+1k+1)=(n+1)k+1–––––k+1∑x=0nxk_=∑x=0n(xk)k!=1k!∑x=kn(xk)=1k!(n+1k+1)=(n+1)k+1_k+1
最后一步的转化可以显然的归纳证明是对的。
而:
∑x=0n∑i=1k−1s(k,i)xi=∑i=1k−1s(k,i)∑x=0nxi=∑i=1k−1s(k,i)Si(n)∑x=0n∑i=1k−1s(k,i)xi=∑i=1k−1s(k,i)∑x=0nxi=∑i=1k−1s(k,i)Si(n)
因此:
Sk(n)=(n+1)k+1–––––k+1−∑i=1k−1s(k,i)Si(n)Sk(n)=(n+1)k+1_k+1−∑i=1k−1s(k,i)Si(n)
这样Si(n)(i=0...k)Si(n)(i=0...k)就可以在O(k2)O(k2)时间内求出。
前面的下降幂下面的除数不能直接逆元算,要特判。
乘法取模不能直接乘,可能会爆炸longlong,因此我开了__int128。
在算g函数的时候需要预处理幂和,这样复杂度显然就是O(pklgpn)O(pklgpn)的了。
#include<iostream>
#include<cstring>
#include<cstdio>
#include<algorithm>
#include<assert.h>
#define lint long long
#define MAXK 200
#define MAXP 100010
#define debug(x) cerr<<#x<<"="<<x
#define sp <<" "
#define ln <<endl
using namespace std;
lint s[MAXK][MAXK],pk[MAXK],ivk[MAXP][MAXK];
inline lint tms(lint x,lint y,lint k) { return (__int128)x*y%pk[k]; }
inline lint fast_pow(lint x,lint k,lint qk)
{
lint ans=1ll;
for(;k;k>>=1,x=tms(x,x,qk))
if(k&1ll) ans=tms(ans,x,qk);
return ans;
}
inline lint prelude_stirling(lint n,lint k)
{
s[1][1]=1;
for(lint i=2;i<=n;i++)
for(lint j=1;j<=i;j++)
s[i][j]=(tms(s[i-1][j],i-1,k)+s[i-1][j-1])%pk[k];
for(lint i=1;i<=n;i++)
for(lint j=1;j<=i;j++)
if((i+j)&1) s[i][j]=(pk[k]-s[i][j])%pk[k];
return 0ll;
}
lint sk1[MAXK],sk2[MAXK];
lint getS(lint k,lint n,lint qk,lint *sk)
{
memset(sk,0,sizeof(lint)*(k+1)),sk[0]=(n+1)%pk[qk];
if(n<=0||k==0) return 0;
if(n&1) sk[1]=tms((n+1)/2,n,qk);
else sk[1]=tms(n/2,n+1,qk);
for(lint i=2;i<=k;i++)
{
if(n-i+1<=0) sk[i]=0;
else{
sk[i]=1;lint nc=1;
for(lint j=n+1;j>=n-i+1;j--)
if(j%(i+1)==0&&nc) sk[i]=tms(sk[i],j/(i+1),qk),nc=0;
else sk[i]=tms(sk[i],j,qk);
}
for(lint j=1;j<i;j++)
{
sk[i]=(sk[i]-tms(sk[j],s[i][j]%pk[qk],qk))%pk[qk];
if(sk[i]<0) sk[i]+=pk[qk];
}
}
return 0ll;
}
lint G(lint n,lint k)
{
lint ans=0ll,r=n%pk[1];
getS(k-1,n/pk[1]-1,k,sk1),getS(k-1,n/pk[1],k,sk2);
for(lint i=0;i<k;i++)
{
lint pi=pk[i],s=0ll;if(i&1) pi=(pk[k]-pi)%pk[k];
for(lint a=1;a<=min(pk[1]-1,n);a++)
if(a<=r) s=(s+tms(ivk[a][i+1]%pk[k],sk2[i],k))%pk[k];
else s=(s+tms(ivk[a][i+1]%pk[k],sk1[i],k))%pk[k];
ans=(ans+tms(pi,s,k))%pk[k];
}
return ans;
}
lint F(lint n,lint k) { return n?(G(n,k)+F(n/pk[1],k+1)/pk[1])%pk[k]:0; }
int main()
{
lint p,k,n;scanf("%lld%lld%lld",&p,&k,&n);
lint qk=k,ns=n;while(ns) ns/=p,k++;
for(lint i=pk[0]=1;i<=k;i++) pk[i]=pk[i-1]*p;
prelude_stirling(k,k);
for(lint i=1;i<p;i++)
{
ivk[i][0]=1,ivk[i][1]=fast_pow(i,pk[k]-pk[k-1]-1,k);
for(lint j=2;j<=k;j++) ivk[i][j]=tms(ivk[i][j-1],ivk[i][1],k);
}
return !printf("%lld\n",F(n,qk));
}