【JZOJ 5559】花朵

本文介绍了一种使用快速傅立叶变换(NTT)优化的树状动态规划算法,该算法可以有效地解决特定类型的问题,如在树上进行计数或求解某些组合问题。文章详细解释了如何通过链剖分和递归划分的方法来优化计算过程,并将复杂度降低到O(n log^3 n)。

Description

这里写图片描述

Solution

暴力O(n3)显然,还可以用NTT优化,
链的做法也简单,先设左/右有没有选,再设选了几个,用分治NTT优化成nlog(n)2
菊花更简单,直接分治NTT,

那树怎么做呢?
链剖,长链上的用链的做法,链顶再用菊花的做法合并,

复杂度:O(nlog(n)3)

Code

#include <cstdio>
#include <algorithm>
#define fo(i,a,b) for(int i=a;i<=b;++i)
#define fod(i,a,b) for(int i=a;i>=b;--i)
#define efo(i,q) for(int i=A[q];i;i=B[i][0])
#define min(q,w) ((q)>(w)?(w):(q))
#define max(q,w) ((q)<(w)?(w):(q))
using namespace std;
typedef long long LL;
const int N=100500,mo=998244353;
int read(int &n)
{
    char ch=' ';int q=0,w=1;
    for(;(ch!='-')&&((ch<'0')||(ch>'9'));ch=getchar());
    if(ch=='-')w=-1,ch=getchar();
    for(;ch>='0' && ch<='9';ch=getchar())q=q*10+ch-48;n=q*w;return n;
}
int m,n,ans;
int B[2*N][2],A[N],B0;
void link(int q,int w)
{
    B[++B0][0]=A[q],A[q]=B0,B[B0][1]=w;
    B[++B0][0]=A[w],A[w]=B0,B[B0][1]=q;
}
LL ksm(LL q,int w)
{
    LL ans=1;
    for(;w;w>>=1,q=q*q%mo)if(w&1)ans=ans*q%mo;
    return ans;
}
LL c[N*3],c1[N*3],c2[N*3];
int W[1048576+10],W0=1048576;
void DFT(LL *a,int n,int ws,int K)
{
    fo(i,0,n-1)
    {
        int q=0;
        for(int j=ws,w=i;j;w>>=1,--j)q=(q<<1)+(w&1);
        c[q]=a[i];
    }
    for(int I=2;I<=n;I<<=1)
    {
        register int mid=I>>1;
        for(int i=0;i<n;i+=I)
        {
            fo(j,0,mid-1)
            {
                LL w=W[K>0?W0/I*j:W0-W0/I*j];
                LL t=w*c[i+j+mid]%mo;
                c[i+j+mid]=(c[i+j]-t)%mo;
                c[i+j]=(c[i+j]+t)%mo;
            }
        }
    }
    if(K<0)
    {
        LL t=ksm(n,mo-2);
        fo(i,0,n-1)c[i]=c[i]*t%mo;
    }
}
void NTT(LL *a,LL *b,int n,int K=0)
{
    int m=1,ws=1;
    for(;m<=n;m<<=1,++ws);
    m<<=1;
    if(!K)fo(i,0,n)c1[i]=a[i],c2[i]=b[i];
    fo(i,n+1,m)c1[i]=c2[i]=0;
    DFT(c1,m,ws,1);
    fo(i,0,m-1)c1[i]=c[i];
    DFT(c2,m,ws,1);
    fo(i,0,m-1)c1[i]=c1[i]*c[i]%mo;
    DFT(c1,m,ws,-1);
}

struct qqww
{
    int v,si,lt,fa,zx,nx;
}a[N];

int d[N],d1[N];
LL F[20][4][N];
int f[N],g[N],fv[N];//YES  NO
int BF[100*N][2],BF0;
void divide(int l,int r,int C,int Alln)
{
    if(l>r)return;
    if(l==r)
    {
        for(int q=f[d[l]],i=0;q;++i,q=BF[q][0])F[C][3][i]=BF[q][1];
        for(int q=g[d[l]],i=0;q;++i,q=BF[q][0])F[C][0][i]=BF[q][1];
        return;
    }
    int mid=l,mid1=-100,mid2=0,t=0;
    fo(i,l,r)
    {
        t+=d1[i];
        if(min(t,Alln-t)>mid1)mid1=min(t,Alln-t),mid2=t,mid=i;
    }
    divide(l,mid,C,mid2);
    divide(mid+1,r,C+1,Alln-mid2);
    mid=min(max(Alln-mid2,mid2),m);
    mid1=min(Alln,m);
    fo(L,0,1)fo(R,0,1)
    {
        fo(i,0,mid)F[0][L*2+R][i]=(F[C+1][2+R][i]+F[C+1][R][i])%mo;
        NTT(F[C][L*2],F[0][L*2+R],mid);
        fo(i,0,mid1)F[0][L*2+R][i]=c[i];
        NTT(F[C][L*2+1],F[C+1][R],mid);
        fo(i,0,mid1)F[0][L*2+R][i]=(F[0][L*2+R][i]+c[i])%mo;
    }
    fo(j,0,3)fo(i,0,mid1)F[C][j][i]=F[0][j][i],F[C+1][j][i]=F[0][j][i]=0;
}
void divide1(int l,int r,int C,int Alln)
{
    if(l>r)return;
    if(l==r)
    {
        for(int q=f[d[l]],i=0;q;++i,q=BF[q][0])F[C][0][i]=BF[q][1];
        for(int q=g[d[l]],i=0;q;++i,q=BF[q][0])F[C][1][i]=BF[q][1];
        return;
    }
    int mid=l,mid1=-100,mid2=0,t=0;
    fo(i,l,r)
    {
        t+=d1[i];
        if(min(t,Alln-t)>mid1)mid1=min(t,Alln-t),mid2=t,mid=i;
    }
    divide1(l,mid,C,mid2);
    divide1(mid+1,r,C+1,Alln-mid2);
    mid=min(max(Alln-mid2,mid2),m);
    mid1=min(Alln,m);
    fo(K,0,1)
    {
        NTT(F[C][K],F[C+1][K],mid);
        fo(i,0,mid1)F[C][K][i]=c[i],F[C+1][K][i]=0;
    }
}


int dfsSi(int q,int fa)
{
    efo(i,q)if(B[i][1]!=fa)a[q].si+=dfsSi(B[i][1],q);
    return ++a[q].si;
}
void dfsf(int q,int fa,int lt)
{
    a[q].fa=fa;
    a[q].lt=(lt?lt:(lt=q));
    int mx=0;
    efo(i,q)if(B[i][1]!=fa&&a[B[i][1]].si>a[mx].si)mx=B[i][1];
    a[q].nx=mx;
    if(mx)dfsf(mx,q,lt);
    efo(i,q)if(B[i][1]!=fa&&B[i][1]!=mx)dfsf(B[i][1],q,0);
}
void dfs(int q,int fa)
{
    BF[g[q]=++BF0][1]=1;fv[q]=1;
    BF[++BF0][1]=a[q].v;BF[BF0+1][0]=BF0;BF[f[q]=++BF0][1]=0;
    efo(i,q)if(B[i][1]!=fa)dfs(B[i][1],q);
    int t=1;
    d[0]=1;d[1]=q;d1[1]=1;
    efo(i,q)if(B[i][1]!=fa&&B[i][1]!=a[q].nx)
        d[++d[0]]=B[i][1],t+=d1[d[0]]=fv[B[i][1]];
    divide1(1,d[0],0,t);
    t=min(m,t);g[q]=f[q]=0;fv[q]=t;
    fod(i,t,0)BF[++BF0][0]=g[q],g[q]=BF0,BF[BF0][1]=F[0][1][i];
    fod(i,t,0)BF[++BF0][0]=f[q],f[q]=BF0,BF[BF0][1]=F[0][0][i];
    fo(j,0,1)fo(i,0,t)F[0][j][i]=0;
    if(a[q].lt==q)
    {
        // printf("%d\n",q);
        int w=q,t=0;
        for(d[0]=0;w;d[++d[0]]=w,t+=d1[d[0]]=fv[w],w=a[w].nx);
        divide(1,d[0],1,t);
        int T=min(m,t);fv[q]=T;
        g[q]=f[q]=0;
        fod(i,T,0)BF[++BF0][0]=g[q],g[q]=BF0,BF[BF0][1]=(F[1][2][i]+F[1][3][i]+F[1][0][i]+F[1][1][i])%mo;
        fod(i,T,0)BF[++BF0][0]=f[q],f[q]=BF0,BF[BF0][1]=(F[1][0][i]+F[1][1][i])%mo;
        fo(j,0,3)fo(i,0,T)F[1][j][i]=0;
    }
}
int main()
{
    freopen("flowers.in","r",stdin);
    freopen("flowers.out","w",stdout);
    int q,w;
    W[0]=1;W[1]=ksm(3,(mo-1)/W0);
    fo(i,2,W0)W[i]=(LL)W[i-1]*W[1]%mo;
    read(n),read(m);
    fo(i,1,n)read(a[i].v);
    fo(i,1,n-1)read(q),read(w),link(q,w);
    dfsSi(1,0);
    dfsf(1,0,0);
    dfs(1,0);
    for(q=g[1];BF[q][0];q=BF[q][0]);
    printf("%d\n",(BF[q][1]+mo)%mo);
    return 0;
}
### 解题思路 题目要求解决的是一个与图相关的最小覆盖问题,通常在特定条件下可以通过状态压缩动态规划(State Compression Dynamic Programming, SCDP)来高效求解。由于状态压缩的适用条件是状态维度较小(例如K≤10),因此可以利用二进制表示状态集合,从而优化计算过程。 #### 1. 状态表示 - 使用一个整数 `mask` 表示当前选择的点集,其中第 `i` 位为 `1` 表示第 `i` 个节点被选中。 - 定义 `dp[mask]` 表示在选中 `mask` 所代表的点集后,能够覆盖的节点集合。 - 可以通过预处理每个点的邻域信息(包括自身和所有直接连接的点),快速更新状态。 #### 2. 预处理邻域 对于每个节点 `u`,预先计算其邻域范围 `neighbor[u]`,即从该节点出发一步能到达的所有节点集合。这样,在后续的状态转移过程中,可以直接使用这些信息进行合并操作。 #### 3. 状态转移 - 初始化:对每个单独节点 `u`,设置初始状态 `dp[1 << u] = neighbor[u]`。 - 转移规则:对于任意两个状态 `mask1` 和 `mask2`,如果它们没有交集,则可以通过合并这两个状态得到新的状态 `mask = mask1 | mask2`,并更新对应的覆盖范围为 `dp[mask1] ∪ dp[mask2]`。 - 在所有状态生成之后,检查是否某个状态的覆盖范围等于全集(即覆盖了所有节点)。如果是,则记录此时使用的最少节点数量。 #### 4. 最优解提取 遍历所有可能的状态,找出能够覆盖整个图的最小节点数目。 --- ### 时间复杂度分析 - 状态总数为 $ O(2^K) $,其中 `K` 是关键点的数量。 - 每次状态转移需要枚举所有可能的子集组合,复杂度为 $ O(2^K \cdot K^2) $。 - 整体时间复杂度控制在可接受范围内,适用于 `K ≤ 10~20` 的情况。 --- ### 代码实现(状态压缩 DP) ```cpp #include <bits/stdc++.h> using namespace std; const int MAXN = 25; int neighbor[MAXN]; // 每个节点的邻域 int dp[1 << 20]; // dp[mask] 表示选中的点集合为 mask 时所能覆盖的点集合 int min_nodes; // 最小覆盖点数 void solve(int n, vector<vector<int>>& graph) { // 预处理每个节点的邻域 for (int i = 0; i < n; ++i) { neighbor[i] = (1 << i); // 包括自己 for (int j : graph[i]) { neighbor[i] |= (1 << j); } } // 初始化 dp 数组 memset(dp, 0x3f, sizeof(dp)); for (int i = 0; i < n; ++i) { dp[1 << i] = neighbor[i]; } // 状态转移 for (int mask = 1; mask < (1 << n); ++mask) { if (__builtin_popcount(mask) >= min_nodes) continue; // 剪枝 for (int sub = mask & (mask - 1); sub; sub = (sub - 1) & mask) { int comp = mask ^ sub; if (comp == 0) continue; int new_mask = mask; int covered = dp[sub] | dp[comp]; if (covered == (1 << n) - 1) { min_nodes = min(min_nodes, __builtin_popcount(new_mask)); } dp[new_mask] = min(dp[new_mask], covered); } } } int main() { int n, m; cin >> n >> m; vector<vector<int>> graph(n); for (int i = 0; i < m; ++i) { int u, v; cin >> u >> v; graph[u].push_back(v); graph[v].push_back(u); // 无向图 } min_nodes = n; solve(n, graph); cout << "Minimum nodes required: " << min_nodes << endl; return 0; } ``` --- ### 优化策略 - **剪枝**:当当前状态所用节点数已经超过已知最优解时,跳过后续计算。 - **提前终止**:一旦发现某个状态覆盖了全部节点,并且节点数达到理论下限,即可提前结束程序。 - **空间优化**:可以仅保存当前轮次的状态,减少内存占用。 --- ### 总结 本题通过状态压缩动态规划的方法,将原本指数级复杂度的问题压缩到可接受范围内。结合位运算技巧和预处理机制,能够高效地完成状态转移和覆盖判断操作。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值