给n个串,要找到一个字符串,这个字符串在这n个串里都出现至少两次,并且不套叠。
先把所有的字符串连接起来(注意用一个不会出现在原串里的字符来分割,最好还是用不同的)
然后二分答案ans,去分段height数组,维护每一段里面,n个最大的出现位置和最小的出现位置。
对于这n个串的每个串,最大位置-最小位置>=ans才是可以的(否则要么是只出现一次,要么是套叠)
还有注意特判一下没有出现的情况。
详情见代码
#include<iostream>
#include<cstdio>
#include<cstring>
#include<vector>
using namespace std;
const int nMax = 300001;
char str[nMax+1];
int sa[nMax], rank[nMax], height[nMax];
int wa[nMax], wb[nMax], wv[nMax], wd[nMax];
int cmp(int *r, int a, int b, int l){
return r[a] == r[b] && r[a+l] == r[b+l];
}
void da(char *r, int n, int m){ // 倍增算法 r为待匹配数组 n为总长度 m为字符范围
int i, j, p, *x = wa, *y = wb, *t;
for(i = 0; i < m; i ++) wd[i] = 0;
for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
for(i = 1; i < m; i ++) wd[i] += wd[i-1];
for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
for(j = 1, p = 1; p < n; j *= 2, m = p){
for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
for(i = 0; i < n; i ++) wv[i] = x[y[i]];
for(i = 0; i < m; i ++) wd[i] = 0;
for(i = 0; i < n; i ++) wd[wv[i]] ++;
for(i = 1; i < m; i ++) wd[i] += wd[i-1];
for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){
x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
}
}
}
void calHeight(char *r, int n){ // 求height数组。
int i, j, k = 0;
for(i = 1; i <= n; i ++)
{
rank[sa[i]] = i;
//cout<<sa[i]<<endl;
}
for(i = 0; i < n; height[rank[i ++]] = k){
for(k ? k -- : 0, j = sa[rank[i]-1]; r[i+k] == r[j+k]; k ++);
}
}
int n;
int len[14];
char input[14][12000];
int minh[14];
int maxh[14];
int find(int sa)
{
if(sa<len[0]-1) return 0;
for(int i=0;i<=n-2;i++)
{
if(sa>=len[i] && sa<len[i+1]-1) return i+1;
}
return -1;
}
bool test(int ans)
{
int seq=0;
for(int i=len[n-1]-1;i>=1;i--)
{
//cout<<height[i]<<endl;
if(height[i]<ans)
{
bool ac=true;
seq=0;
for(int j=0;j<n;j++)
{
if(minh[j]==0x3f3f3f3f || maxh[j]==-1)//有的字符串里没有出现过
{
ac=false;
break;
}
if(maxh[j]-minh[j]<ans)//有套叠 || 次数不够
{
ac=false;
break;
}
}
if(ac==true) return true;
memset(minh,0x3f,sizeof(minh));
memset(maxh,-1,sizeof(maxh));
}
else
{
if(seq==0)
{
seq+=2;
int ia=find(sa[i]);
int ib=find(sa[i-1]);
//cout<<sa[i]<<endl;
minh[ia]=min(minh[ia],sa[i]);
maxh[ia]=max(maxh[ia],sa[i]);
minh[ib]=min(minh[ib],sa[i-1]);
maxh[ib]=max(maxh[ib],sa[i-1]);
}
else
{
seq++;
int ib=find(sa[i-1]);
//cout<<sa[i-1]<<endl;
minh[ib]=min(minh[ib],sa[i-1]);
maxh[ib]=max(maxh[ib],sa[i-1]);
}
}
}
return false;
}
int main()
{
int t;
cin>>t;
while(t--)
{
cin>>n;
int pt=0;
for(int i=0;i<n;i++)
{
scanf("%s",input[i]);
if(i==0) len[i]=strlen(input[i])+1;
else len[i]=len[i-1]+strlen(input[i])+1;
//cout<<len[i]<<endl;
int temp_len=strlen(input[i]);
for(int j=0;j<temp_len;j++)
{
str[pt]=input[i][j];
pt++;
}
if(i==n-1) str[pt]=0;
else str[pt]=i+1;
pt++;
}
da(str,len[n-1],140);
calHeight(str,len[n-1]-1);
int l,r;
l=1;
r=10000;
int ans=0;
while(l<=r)
{
int mid=(l+r)/2;
memset(minh,0x3f,sizeof(minh));
memset(maxh,-1,sizeof(maxh));
if(test(mid)==true)
{
ans=max(ans,mid);
l=mid+1;
}
else r=mid-1;
}
printf("%d\n",ans);
}
return 0;
}
本文介绍了一种用于寻找多个字符串中至少出现两次且不套叠的公共子串的方法。通过将字符串连接并使用特殊字符分割,利用二分查找和高度数组来确定符合条件的最长子串长度。
2918

被折叠的 条评论
为什么被折叠?



