注意到小于n√ 的质数最多有8个。而大于n√ 的质因子每个数至多有1个。
因此状压<n√ 的质数。
设f[i][j] 表示A选的<n√ 的质数集合为i的子集,B选的<n√ 的质数集合为j的子集的方案数。
预处理num[i][j] 表示<n√ 的质因子集合为i,>n√ 的质因子为j的数的个数。
g0[i] 表示没有>n√ 的质因子,<n√ 质因子集合为i的子集的数的选法(2^个数)。
f[i][j]=g0[i]∗g0[j]
然后枚举>n√ 的质数x,计算g[i] 表示>n√ 的质因子为x,<n√ 质因子集合为i的子集的数的选法(2^个数-1)。
f[i][j]=f[i][j]∗(g[j]+g[i]−1)
最后对两维分别容斥。
复杂度O(87∗38+58)
速度仅次于打表。。。
#include <bits/stdc++.h>
using namespace std;
#define N 510
#define A 256
#define M A+10
#define ll long long
int n,p,ans;
int num[N][M],f[M][M],g[M],bir[N],g0[M];
int pr[11]={2,3,5,7,11,13,17,19};
void cal(int x)
{
g[0]=bir[num[x][0]]-1;
for(int i=1;i<A;i++)
{
int sum=num[x][0];
for(int j=i;j;j=(j-1)&i)
sum+=num[x][j];
g[i]=bir[sum]-1;
}
for(int i=0;i<A;i++)
for(int j=A-i-1;;j=(A-i-1)&(j-1))
{
f[i][j]=(ll)f[i][j]*(g[j]+g[i]+1)%p;
if(!j)break;
}
}
int main()
{
//freopen("tt.in","r",stdin);
scanf("%d%d",&n,&p);
bir[0]=1;
for(int i=1;i<=n;i++)bir[i]=bir[i-1]*2%p;
for(int i=2;i<=n;i++)
{
int t=i,now=0;
for(int j=0;j<8;j++)
{
if(t%pr[j]==0)now+=1<<j;
while(t%pr[j]==0)t/=pr[j];
}
num[t][now]++;
}
g0[0]=bir[num[1][0]];
for(int i=1;i<A;i++)
{
int sum=num[1][0];
for(int j=i;j;j=(j-1)&i)
sum+=num[1][j];
g0[i]=bir[sum];
}
for(int i=0;i<A;i++)
for(int j=0;j<A;j++)
if(!(i&j))f[i][j]=(ll)g0[i]*g0[j]%p;
for(int i=23;i<=n;i++)
{
int flag=1;
for(int j=2;j<i;j++)
if(i%j==0)flag=0;
if(flag)cal(i);
}
for(int i=1;i<A;i++)
for(int j=0;j<A;j++)if(!(i&j))
for(int k=i&(i-1);;k=i&(k-1))
{
f[i][j]=(f[i][j]-f[k][j]+p)%p;
if(!k)break;
}
for(int i=0;i<A;i++)
for(int j=1;j<A;j++)if(!(i&j))
for(int k=j&(j-1);;k=j&(k-1))
{
f[i][j]=(f[i][j]-f[i][k]+p)%p;
if(!k)break;
}
for(int i=0;i<A;i++)
for(int j=0;j<A;j++)
if(!(i&j))ans=(ans+f[i][j])%p;
printf("%d\n",ans);
return 0;
}