链接 http://poj.org/problem?id=3294
题意:给你n个字符串,n小于100,每个字符串的长度小于1000,让你找出至少在一半的字符串中出现过得最长的一个字串,如果有多个,那就按照字典序逐个输出
思路:我们先把所有的字符串连成一个大的字符串,每个字符串之间用一个没有出现过得字符xx隔开(注意这个字符也要两两不同),在把所有串连成一个大串的过程中,我们用一个set来把每个xx的位置都存下来。接着我们跑一边后缀数组,然后二分枚举目标串的最大长度y,看有没有一个长度为y的字串在至少一半的字符串中出现过,方法是从前到后遍历一边height数组,肯height的值是不是大于y,如果是,就表示这相邻的两个后缀的公共前缀的长度大于y,这时候我们需要判断一下这些串是不是在原来的一个字符串中,如果是,那么就不能算,我们可以知道这两个串的位置i和j,我们只要用set的upper_bone函数求出在i和j后面的第一个字符xx,看是否相等,就知道他们是不是在一个串中了,然后我们用一个flag数组把出现过得字串记录下来,再接着往后扫描height数组,如果还是>y,那么就再求出他们这两个后缀属于的原先的字符串的下标,看之前有没有出现过,没有就num++;如果<y,就看2*num是否大于n,至于怎么输出,我们只要从前往后扫描height数组,操作和之前的判断一样,找到了就输出,因为一定是按字典序拍好的。
是个好题,多思考,一些细节就自己独立完成吧
#include<cstdio>
#include<cstring>
#include<iostream>
#include<cmath>
#include<set>
#include<string>
#include<map>
using namespace std;
int const N= 200010;
int wa[N], wb[N], w[N], wv[N];
int sa[N], height[N], Rank[N],r[N];
int dp[N][25];
char str1[N],str2[N];
int n;
int len;
set<int>g;
map<int,int>gg;
int cmp( int* r, int a, int b, int L ){
return r[a]== r[b] && r[a+ L]== r[b+ L];
}
void da( int* r, int* sa, int n, int m ){
int i, j, p, *x= wa, *y= wb, *t;
for( i= 0; i< m; ++i ) w[i]= 0;
for( i= 0; i< n; ++i ) w[ x[i]= r[i] ]++;
for( i= 1; i< m; ++i ) w[i]+= w[i-1];
for( i= n- 1; i>= 0; i-- ) sa[ --w[ x[i] ] ]= i;
for( j= 1, p= 1; p< n; j*= 2, m= p ){
for( p= 0, i= n- j; i< n; ++i ) y[p++]= i;
for( i= 0; i< n; ++i )
if( sa[i]>= j ) y[p++]= sa[i]- j;
for( i= 0; i< n; ++i ) wv[i]= x[y[i]];
for( i= 0; i< m; ++i ) w[i]= 0;
for( i= 0; i< n; ++i ) w[ wv[i] ]++;
for( i= 1; i< m; ++i ) w[i]+= w[i-1];
for( i= n- 1; i>= 0; i-- ) sa[ --w[ wv[i] ] ]= y[i];
t= x, x= y, y= t, p= 1; x[ sa[0] ]= 0;
for( i= 1; i< n; ++i )
x[ sa[i] ]= cmp( y, sa[i-1], sa[i], j )? p- 1: p++;
}
}
void callheight( int* r, int*sa, int n ){
int i, j, k= 0;
for( i= 1; i<= n; ++i ) Rank[ sa[i] ]= i;
for( i= 0; i< n; height[ Rank[i++] ]= k )
for( k?k--:0, j= sa[ Rank[i]- 1]; r[i+k]== r[j+k]; k++ );
}
void RMQ(int n){
int m=(int)(log(n*1.0)/log(2.0))+2;
for(int i=1;i<=n;i++)
dp[i][0]=height[i];
for(int i=1;i<m;i++){
for(int j=1;j<=n;j++) if(j+(1<<i)-1<=n){
dp[j][i]=min(dp[j][i-1],dp[j+(1<<(i-1))][i-1]);
}
}
}
int getRMQ(int l,int r){
if(l>r) swap(l,r);
l++;
int m=(int)(log(1.0*r-l+1)/log(2.0));
return min(dp[l][m],dp[r-(1<<m)+1][m]);
}
//以上都是模板
bool check(int x){
bool flag[110];
int num=0;
memset(flag,0,sizeof(flag));
for(int i=1;i<=len;i++){
if(height[i]>=x){
int a=*g.upper_bound(sa[i-1]);
int b=*g.upper_bound(sa[i]);
if(flag[gg[a]]==0){
num++;
flag[gg[a]]=1;
}
if(flag[gg[b]]==0){
num++;
flag[gg[b]]=1;
}
}
else {
if(2*num>n) return 1;
num=0;
memset(flag,0,sizeof(flag));
}
}
if(2*num>n) return 1;
return 0;
}
void print(int x){
bool flag[110];
memset(flag,0,sizeof(flag));
int num=0;
for(int i=1;i<=len;i++){
if(height[i]>=x){
int a=*g.upper_bound(sa[i-1]);
int b=*g.upper_bound(sa[i]);
if(flag[gg[a]]==0){
num++;
flag[gg[a]]=1;
}
if(flag[gg[b]]==0){
num++;
flag[gg[b]]=1;
}
}
else {
if(2*num>n){
int xx=sa[i-1];
for(int i=0;i<x;i++)
printf("%c",str1[xx+i]);
cout<<endl;
}
num=0;
memset(flag,0,sizeof(flag));
}
}
if(2*num>n){
int xx=sa[len-1];
for(int i=0;i<x;i++)
printf("%c",str1[xx+i]);
cout<<endl;
}
cout<<endl;
}
int main()
{
while(cin>>n&&n){
if(n==1){
cin>>str1;
cout<<str1<<endl<<endl;
continue;
}
getchar();
len=0;
g.clear();
gg.clear();
memset(str1,0,sizeof(str1));
char xx=1;
int yy=0;
for(int i=0;i<n;i++){
cin>>str2;
int len2=strlen(str2);
strcat(str1,str2);
len+=len2;
str1[len++]=xx;
xx=(xx+1)%50;
if(xx==0) xx++;
str1[len]=0;
g.insert(len-1);
gg[len-1]=yy++;
}
for(int i=0;i<len;i++)
r[i]=str1[i];
r[len]=0;
da(r,sa,len+1,256);
callheight(r,sa,len);
int l=0,r=len,mid;
while(r-l>1){
mid=(l+r)/2;
if(check(mid)) l=mid;
else r=mid-1;
}
if(check(l+1)) l++;
if(l==0) cout<<'?'<<endl<<endl;
else print(l);
}
return 0;
}