poj3080,poj3450 多个字符串求最长公共子串问题 KMP,SA,SAM:

该博客探讨了如何解决多个字符串的最长公共子串问题,介绍了使用KMP、后缀数组(SA)和后缀自动机(SAM)三种方法,分别适用于不同规模的数据。对于POJ3080和POJ3450两道题目,博主提供了具体的思路,如利用SA和KMP在O(NlogN)和O(N)的时间复杂度内求解,并给出了KMP算法在处理大量字符串时的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

      这两题都是给若干个字符串,求他们的最长公共子串,这类题可以KMP,后缀数组,后缀自动机都可以做,前两个复杂度是O(NlogN),最后一个理论上是O(N),后缀自动的做法参考spoj上这个题:http://blog.youkuaiyun.com/night_raven/article/details/12438039。

     3080只有10个串,长度为60,用后缀数组的话,就把所有串串起来,求出height[]数组后,二分长度判断是否有解,判断的时候线性扫描一下,状压记录一下那些串取到了,所有串都取到并且这一段的height[]都大于当前长度就是true,否则就是false。。

      用kmp的话,同样是二分长度,然后枚举第一个串的子串去所有的串中匹配一边,代码上还是Kmp要好写点..

     3450有1000个串,串很多的时候后缀数组写起来就比较蛋疼了..这题些成kmp方便一些。

3080:

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <string>
#include <cstring>
using namespace std;
typedef long long ll;
const int maxn=10100;
int s[maxn],rs[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
int n,m,k,tt;
char s1[maxn],s2[maxn];
int rank[maxn],height[maxn];
int l1,l2;
int len,len1;
inline int idx(char s)
{
//   return s-'A'+11;
     if (s=='A') return 11;
     if (s=='T') return 14;
     if (s=='G') return 13;
     return 12;
}
void getheight(int n)
{
    int i,j,k=0;
    for (i=0; i<=n; i++) rank[sa[i]]=i;
    for (i=0; i<n; i++)
    {
        if (k) k--;
        int j=sa[rank[i]-1];
        while(s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}

void build_ss(int m,int n)
{
    n++;
    int i,*x=t,*y=t2;
    for (int i=0; i<m; i++) c[i]=0;
    for (int i=0; i<n; i++) c[x[i]=s[i]]++;
    for (int i=1; i<m; i++) c[i]+=c[i-1];
    for (int i=n-1; i>=0; i--)
      sa[--c[x[i]]]=i;
    for (int k=1; k<=n; k<<=1)
    {
        int p=0;
        for (i=n-k; i<n; i++) y[p++]=i;
        for (i=0; i<n; i++) if (sa[i]>=k) y[p++]=sa[i]-k;

        for (i=0; i<m; i++) c[i]=0;
        for (i=0; i<n; i++) c[x[y[i]]]++;
        for (i=1; i<m; i++) c[i]+=c[i-1];
        for (i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
        swap(x,y);
        p=1;
        x[sa[0]]=0;
        for (i=1; i<n; i++)
        x[sa[i]]=(y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k])? p-1 : p++;
        if (p>=n) break;
        m=p;
    }
}
int d[maxn][22];
void RMQ_init()
{
    for (int i=1; i<=n; i++) d[i][0]=height[i];
     for (int j=1; (1<<j)<=n; j++)
      for (int i=1; (i+(1<<j)-1)<=n; i++)
      d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)
{
    int k=0;
    while((1<<(k+1))<=R-L+1) k++;
    return min(d[L][k],d[R-(1<<k)+1][k]);
}
int belong[maxn];
bool check(int ans,int &pos)
{
    int sta=0;
    for (int i=1; i<=len; i++)
    {
        if (height[i]>=ans)
        {
            sta|=(1<<belong[sa[i-1]]);
            sta|=(1<<belong[sa[i]]);
            pos=sa[i-1];
        }
        else
        {
            sta=0;
        }
        if (sta==(1<<(n))-1) return true;
    }
    return false;
}
char cg(int x)
{
    if (x==11) return 'A';
    if (x==12) return 'C';
    if (x==13) return 'G';
    if (x==14) return 'T';
}
int main()
{
//    freopen("in.txt","r",stdin);
    scanf("%d",&tt);
    while(tt--)
    {
        scanf("%d",&n);
        len=0;
        int ct=1;
        for (int i=0; i<n; i++)
        {
            scanf("%s",s1);
            for (int j=0; j<strlen(s1); j++)
            belong[len]=i,s[len++]=idx(s1[j]);
            belong[len]=-1;
            s[len++]=ct++;
        }
        s[len]=0;
        build_ss(15,len);
        getheight(len);
        int l=0,r=len;
        int pos;
        while(l<r)
        {
            int mid=(l+r)>>1;
            if (check(mid,pos)) l=mid+1;
            else r=mid;
        }
        if (l-1<3)
        {
            puts("no significant commonalities");
        }
        else
        {
            check(l-1,pos);
            for (int j=0; j<l-1; j++)
            printf("%c",cg(s[pos++]));
            printf("\n");
        }
    }

}


3450

#include <iostream>
#include <algorithm>
#include <cmath>
#include <cstdio>
#include <algorithm>
#include <stack>
#include <queue>
#include <map>
#include <string>
#include <cstring>
#include <string>
using namespace std;
typedef long long ll;
char s[4400][220];
int f[220];
char ans[220],tmp[220];
int n,m,k;
bool as;
void getFail(char* P,int* f)
{
    int m=strlen(P);
    f[0]=0;
    f[1]=0;
    for (int i=1; i<m; i++)
    {
        int j=f[i];
        while(j && P[i]!=P[j]) j=f[j];
        f[i+1]=P[i]==P[j]?j+1:0;
    }
}
bool find(char* T,char* P,int* f)
{
    int n=strlen(T);
    int m=strlen(P);
//    getFail(P,f);
    int j=0;
    for (int i=0; i<n; i++)
    {
        while(j && P[j]!=T[i]) j=f[j];
        if (P[j]==T[i]) j++;
        if (j==m) return true;
    }
    return false;
}

bool check(int x)
{
    int l=strlen(s[0]);
    int ct=0,cp=0;
    bool res=false;
    for (int i=0; i+x<=l; i++)
    {
        cp=i;
        ct=0;
        while(ct<x)
        {
            tmp[ct++]=s[0][cp++];
        }
        tmp[ct]='\0';
        if (as)
        {
            if (strlen(ans)==strlen(tmp) && strcmp(ans,tmp)<0)
            continue;
        }

        bool ok=true;
        getFail(tmp,f);
        for (int i=1; i<n; i++)
         if (!find(s[i],tmp,f))
         {
             ok=false;
             break;
         }
        if (ok)
        {
            strcpy(ans,tmp);
            res=true;
            as=true;
        }
    }
    return res;
}

int main()
{
    int tt;
//    freopen("in.txt","r",stdin);
    while(~scanf("%d",&n) && n)
    {
        for (int i=0; i<n; i++)
        scanf("%s",s[i]);
        as=false;
        int l=0,r=200;
        int pos=0;
        while(l<r)
        {
            int mid=(l+r)>>1;
            if (check(mid)) l=mid+1;
            else r=mid;
        }
        if (l<=1) puts("IDENTITY LOST");
        else
        {
            puts(ans);
        }
    }

    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值