做的时候题意理解错了,然后爆0。。
题目大意
给你n个两两不同字符串,把它们按任意顺序排列。对于排列中的第i个字符串:
1. 如果存在一个字符串是它的后缀,并且不在它前面,那么费用增加n*n
2. 如果它的前面不存在一个是它的后缀,那么费用增加i
3. 如果前面存在一个是它的后缀,那么费用增加i-j(j是前面所有它的后缀中,最后的位置)
数据范围
n≤100000 字符串总长≤510000
分析
后缀比较难处理,那么把 n个单词倒过来,就变成了前缀,所以显然可以把它们倒过来放到trie里。
最优方案一定不能触发第一个条件,因为其它条件的费用加起来一定不会超过n*n。
所以对于一个字符串,如果存在另一个是它的后缀,一定要放在它的前面。
接着考虑按什么顺序放字符串。对于trie上的一条路径,它经过了若干个字符串,这些字符串放的顺序一定是按深度从小到大放的。
然后考虑trie上的一个节点,它可能有多个儿子,那么设size[i]为以i为根的子树有多少个字符串,那么这个先后顺序显然是先把size最小的子树放完,再放第二小的,一次类推。证明相当于贪心算法的接水问题。
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn=100005,maxm=510005;
typedef long long LL;
int n,st[maxn],tot,cnt,e[maxm][26],pos[maxm],data[maxm],fa[maxm],f[maxm],size[maxm],h[maxm],y[maxm],next[maxm];
bool End[maxm];
struct Data
{
int x,id;
}A[maxm];
LL ans;
char s[maxm],t[maxm];
bool cmp(Data a,Data b)
{
return a.x<b.x;
}
void add(int x,int z)
{
y[++cnt]=z; next[cnt]=h[x]; h[x]=cnt;
}
int main()
{
scanf("%d",&n);
for (int i=0;i<n;i++)
{
st[i]=tot;
scanf("%s",t);
tot+=strlen(t);
for (int j=st[i];j<tot;j++) s[j]=t[j-st[i]];
}
st[n]=tot;
tot=0;
for (int i=0;i<n;i++)
{
int x=0;
for (int j=st[i+1]-1;j>=st[i];j--)
{
if (!e[x][s[j]-'a']) e[x][s[j]-'a']=++tot;
x=e[x][s[j]-'a'];
}
End[x]=1;
}
data[tot=1]=0;
for (int i=1;i<=tot;i++)
for (int j=0;j<26;j++) if (e[data[i]][j])
{
data[++tot]=e[data[i]][j];
if (!End[data[tot]]) f[data[tot]]=f[data[i]];else f[data[tot]]=data[tot];
fa[data[tot]]=data[i];
}
End[0]=1;
for (int i=2;i<=tot;i++) if (End[data[i]]) add(f[fa[data[i]]],data[i]);
data[tot=1]=0;
for (int i=1;i<=tot;i++)
{
int x=data[i];
for (int j=h[x];j;j=next[j])
{
data[++tot]=y[j];
fa[y[j]]=x;
}
}
for (int i=tot;i>1;i--) size[fa[data[i]]]+=size[data[i]]+1;
for (int i=1;i<=tot;i++)
{
int s=0,calc=0;
for (int j=h[data[i]];j;j=next[j])
{
A[s].id=y[j]; A[s++].x=size[y[j]];
}
sort(A,A+s,cmp);
for (int j=0;j<s;j++)
{
pos[A[j].id]=pos[data[i]]+calc+1;
calc+=A[j].x+1;
}
}
for (int i=2;i<=tot;i++) ans+=pos[data[i]]-pos[fa[data[i]]];
printf("%lld\n",ans);
return 0;
}