poj 3294 后缀数组

链接 http://poj.org/problem?id=3294

题意:给你n个字符串,n小于100,每个字符串的长度小于1000,让你找出至少在一半的字符串中出现过得最长的一个字串,如果有多个,那就按照字典序逐个输出

思路:我们先把所有的字符串连成一个大的字符串,每个字符串之间用一个没有出现过得字符xx隔开(注意这个字符也要两两不同),在把所有串连成一个大串的过程中,我们用一个set来把每个xx的位置都存下来。接着我们跑一边后缀数组,然后二分枚举目标串的最大长度y,看有没有一个长度为y的字串在至少一半的字符串中出现过,方法是从前到后遍历一边height数组,肯height的值是不是大于y,如果是,就表示这相邻的两个后缀的公共前缀的长度大于y,这时候我们需要判断一下这些串是不是在原来的一个字符串中,如果是,那么就不能算,我们可以知道这两个串的位置i和j,我们只要用set的upper_bone函数求出在i和j后面的第一个字符xx,看是否相等,就知道他们是不是在一个串中了,然后我们用一个flag数组把出现过得字串记录下来,再接着往后扫描height数组,如果还是>y,那么就再求出他们这两个后缀属于的原先的字符串的下标,看之前有没有出现过,没有就num++;如果<y,就看2*num是否大于n,至于怎么输出,我们只要从前往后扫描height数组,操作和之前的判断一样,找到了就输出,因为一定是按字典序拍好的。

是个好题,多思考,一些细节就自己独立完成吧

#include<cstdio>
#include<cstring>
#include<iostream>
#include<cmath>
#include<set>
#include<string>
#include<map>
using namespace std;

int const N= 200010;
int wa[N], wb[N], w[N], wv[N];
int sa[N], height[N], Rank[N],r[N];
int dp[N][25];
char str1[N],str2[N];
int n;
int len;
set<int>g;
map<int,int>gg;

int cmp( int* r, int a, int b, int L ){
    return r[a]== r[b] && r[a+ L]== r[b+ L];
}

void da( int* r, int* sa, int n, int m ){
    int i, j, p, *x= wa, *y= wb, *t;
    for( i= 0; i< m; ++i ) w[i]= 0;
    for( i= 0; i< n; ++i ) w[ x[i]= r[i] ]++;
    for( i= 1; i< m; ++i ) w[i]+= w[i-1];
    for( i= n- 1; i>= 0; i-- ) sa[ --w[ x[i] ] ]= i;

    for( j= 1, p= 1; p< n; j*= 2, m= p ){
        for( p= 0, i= n- j; i< n; ++i ) y[p++]= i;
        for( i= 0; i< n; ++i )
            if( sa[i]>= j ) y[p++]= sa[i]- j;

        for( i= 0; i< n; ++i ) wv[i]= x[y[i]];
        for( i= 0; i< m; ++i ) w[i]= 0;
        for( i= 0; i< n; ++i ) w[ wv[i] ]++;
        for( i= 1; i< m; ++i ) w[i]+= w[i-1];
        for( i= n- 1; i>= 0; i-- ) sa[ --w[ wv[i] ] ]= y[i];

        t= x, x= y, y= t, p= 1; x[ sa[0] ]= 0;
        for( i= 1; i< n; ++i )
            x[ sa[i] ]= cmp( y, sa[i-1], sa[i], j )? p- 1: p++;
    }
}

void callheight( int* r, int*sa, int n ){
    int i, j, k= 0;
    for( i= 1; i<= n; ++i ) Rank[ sa[i] ]= i;
    for( i= 0; i< n; height[ Rank[i++] ]= k )
        for( k?k--:0, j= sa[ Rank[i]- 1]; r[i+k]== r[j+k]; k++ );
}

void RMQ(int n){
    int m=(int)(log(n*1.0)/log(2.0))+2;
    for(int i=1;i<=n;i++)
        dp[i][0]=height[i];
    for(int i=1;i<m;i++){
        for(int j=1;j<=n;j++) if(j+(1<<i)-1<=n){
            dp[j][i]=min(dp[j][i-1],dp[j+(1<<(i-1))][i-1]);
        }
    }
}

int getRMQ(int l,int r){
    if(l>r) swap(l,r);
    l++;
    int m=(int)(log(1.0*r-l+1)/log(2.0));
    return min(dp[l][m],dp[r-(1<<m)+1][m]);
}

//以上都是模板

bool check(int x){
    bool flag[110];
    int num=0;
    memset(flag,0,sizeof(flag));
    for(int i=1;i<=len;i++){
        if(height[i]>=x){
            int a=*g.upper_bound(sa[i-1]);
            int b=*g.upper_bound(sa[i]);
            if(flag[gg[a]]==0){
                num++;
                flag[gg[a]]=1;
            }
            if(flag[gg[b]]==0){
                num++;
                flag[gg[b]]=1;
            }
        }
        else {
            if(2*num>n) return 1;
            num=0;
            memset(flag,0,sizeof(flag));
        }
    }
    if(2*num>n) return 1;
    return 0;
}

void print(int x){
    bool flag[110];
    memset(flag,0,sizeof(flag));
    int num=0;
    for(int i=1;i<=len;i++){
        if(height[i]>=x){
            int a=*g.upper_bound(sa[i-1]);
            int b=*g.upper_bound(sa[i]);
            if(flag[gg[a]]==0){
                num++;
                flag[gg[a]]=1;
            }
            if(flag[gg[b]]==0){
                num++;
                flag[gg[b]]=1;
            }
        }
        else {
            if(2*num>n){
                int xx=sa[i-1];
                for(int i=0;i<x;i++)
                    printf("%c",str1[xx+i]);
                cout<<endl;
            }
            num=0;
            memset(flag,0,sizeof(flag));
        }
    }
    if(2*num>n){
        int xx=sa[len-1];
        for(int i=0;i<x;i++)
            printf("%c",str1[xx+i]);
        cout<<endl;
    }
    cout<<endl;
}

int main()
{
    while(cin>>n&&n){
        if(n==1){
            cin>>str1;
            cout<<str1<<endl<<endl;
            continue;
        }
        getchar();
        len=0;
        g.clear();
        gg.clear();
        memset(str1,0,sizeof(str1));
        char xx=1;
        int yy=0;
        for(int i=0;i<n;i++){
            cin>>str2;
            int len2=strlen(str2);
            strcat(str1,str2);
            len+=len2;
            str1[len++]=xx;
            xx=(xx+1)%50;
            if(xx==0) xx++;
            str1[len]=0;
            g.insert(len-1);
            gg[len-1]=yy++;
        }
        for(int i=0;i<len;i++)
            r[i]=str1[i];
        r[len]=0;
        da(r,sa,len+1,256);
        callheight(r,sa,len);
        int l=0,r=len,mid;
        while(r-l>1){
            mid=(l+r)/2;
            if(check(mid)) l=mid;
            else r=mid-1;
        }
        if(check(l+1)) l++;
        if(l==0) cout<<'?'<<endl<<endl;
        else print(l);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值