[Scoi2016]背单词

最新推荐文章于 2025-02-17 20:45:43 发布

原创最新推荐文章于 2025-02-17 20:45:43 发布 · 829 阅读

0 ·

CC 4.0 BY-SA版权

string 同时被 3 个专栏收录

14 篇文章

订阅专栏

贪心算法

7 篇文章

订阅专栏

trie

6 篇文章

订阅专栏

该博客讲述了Scoi2016比赛中关于单词排列的题目，由于对题意理解错误导致初始失败。题目要求避免字符串间形成额外费用，通过将单词视为前缀放入Trie并按深度优先顺序排列，确保最优解。分析中提到，最优策略是避免触发第一种费用增加条件，并按子树大小从小到大顺序放置节点。

做的时候题意理解错了，然后爆0。。

题目大意

给你n个两两不同字符串，把它们按任意顺序排列。对于排列中的第i个字符串：
1. 如果存在一个字符串是它的后缀，并且不在它前面，那么费用增加n*n
2. 如果它的前面不存在一个是它的后缀，那么费用增加i
3. 如果前面存在一个是它的后缀，那么费用增加i-j（j是前面所有它的后缀中，最后的位置）

数据范围

n≤100000 字符串总长≤510000

分析

后缀比较难处理，那么把 n个单词倒过来，就变成了前缀，所以显然可以把它们倒过来放到trie里。
最优方案一定不能触发第一个条件，因为其它条件的费用加起来一定不会超过n*n。
所以对于一个字符串，如果存在另一个是它的后缀，一定要放在它的前面。

接着考虑按什么顺序放字符串。对于trie上的一条路径，它经过了若干个字符串，这些字符串放的顺序一定是按深度从小到大放的。
然后考虑trie上的一个节点，它可能有多个儿子，那么设size[i]为以i为根的子树有多少个字符串，那么这个先后顺序显然是先把size最小的子树放完，再放第二小的，一次类推。证明相当于贪心算法的接水问题。

#include <cstdio>
#include <cstring>
#include <algorithm>

using namespace std;

const int maxn=100005,maxm=510005;

typedef long long LL;

int n,st[maxn],tot,cnt,e[maxm][26],pos[maxm],data[maxm],fa[maxm],f[maxm],size[maxm],h[maxm],y[maxm],next[maxm];

bool End[maxm];

struct Data
{
    int x,id;
}A[maxm];

LL ans;

char s[maxm],t[maxm];

bool cmp(Data a,Data b)
{
    return a.x<b.x;
}

void add(int x,int z)
{
    y[++cnt]=z; next[cnt]=h[x]; h[x]=cnt;
}

int main()
{
    scanf("%d",&n);
    for (int i=0;i<n;i++)
    {
        st[i]=tot;
        scanf("%s",t);
        tot+=strlen(t);
        for (int j=st[i];j<tot;j++) s[j]=t[j-st[i]];
    }
    st[n]=tot;
    tot=0;
    for (int i=0;i<n;i++)
    {
        int x=0;
        for (int j=st[i+1]-1;j>=st[i];j--)
        {
            if (!e[x][s[j]-'a']) e[x][s[j]-'a']=++tot;
            x=e[x][s[j]-'a'];
        }
        End[x]=1;
    }
    data[tot=1]=0;
    for (int i=1;i<=tot;i++)
        for (int j=0;j<26;j++) if (e[data[i]][j])
        {
            data[++tot]=e[data[i]][j];
            if (!End[data[tot]]) f[data[tot]]=f[data[i]];else f[data[tot]]=data[tot];
            fa[data[tot]]=data[i];
        }
    End[0]=1;
    for (int i=2;i<=tot;i++) if (End[data[i]]) add(f[fa[data[i]]],data[i]);
    data[tot=1]=0;
    for (int i=1;i<=tot;i++)
    {
        int x=data[i];
        for (int j=h[x];j;j=next[j])
        {
            data[++tot]=y[j];
            fa[y[j]]=x;
        }
    }
    for (int i=tot;i>1;i--) size[fa[data[i]]]+=size[data[i]]+1;
    for (int i=1;i<=tot;i++)
    {
        int s=0,calc=0;
        for (int j=h[data[i]];j;j=next[j])
        {
            A[s].id=y[j]; A[s++].x=size[y[j]];
        }
        sort(A,A+s,cmp);
        for (int j=0;j<s;j++)
        {
            pos[A[j].id]=pos[data[i]]+calc+1;
            calc+=A[j].x+1;
        }
    }
    for (int i=2;i<=tot;i++) ans+=pos[data[i]]-pos[fa[data[i]]];
    printf("%lld\n",ans);
    return 0;
}