【UVa】760 DNA Sequencing

本文详细介绍了一种高效的字符串匹配算法,包括其核心数据结构和算法流程。通过实例演示了如何使用该算法来解决两个字符串间的最长公共子串问题,并提供了完整的C/C++实现代码。
  1 #include<cstdio>
  2 #include<cstring>
  3 #define MAXN 660
  4 char s[MAXN];
  5 int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN];
  6 int sa[MAXN],height[MAXN],rk[MAXN];
  7 inline bool cmp(int *r,int a,int b,int L)
  8 {
  9     return r[a]==r[b]&&r[a+L]==r[b+L];
 10 }
 11 void SA(int n,int m)
 12 {
 13     int i,j,p,*x=wa,*y=wb,*t;
 14     for(i=0;i<m;i++)
 15         ws[i]=0;
 16     for(i=0;i<n;i++)
 17         ws[x[i]=s[i]]++;
 18     for(i=1;i<m;i++)
 19         ws[i]+=ws[i-1];
 20     for(i=n-1;i>=0;i--)
 21         sa[--ws[x[i]]]=i;
 22     for(j=p=1;p<n;j<<=1,m=p)
 23     {
 24         for(p=0,i=n-j;i<n;i++)
 25             y[p++]=i;
 26         for(i=0;i<n;i++)
 27         {
 28             if(sa[i]>=j)
 29                 y[p++]=sa[i]-j;
 30         }
 31         for(i=0;i<m;i++)
 32             ws[i]=0;
 33         for(i=0;i<n;i++)
 34             ws[wv[i]=x[y[i]]]++;
 35         for(i=1;i<m;i++)
 36             ws[i]+=ws[i-1];
 37         for(i=n-1;i>=0;i--)
 38             sa[--ws[wv[i]]]=y[i];
 39         for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)
 40             x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
 41     }
 42 }
 43 void Height(int n)
 44 {
 45     int i,j,k;
 46     for(i=1;i<=n;i++)
 47         rk[sa[i]]=i;
 48     for(i=k=0;i<n;height[rk[i++]]=k)
 49         for(k?k--:0,j=sa[rk[i]-1];s[i+k]==s[j+k];k++);
 50 }
 51 bool OK(int n,int len,int mid)
 52 {
 53     int i,j;
 54     for(i=1;i<=n;i++)
 55     {
 56         if(height[i]>=mid)
 57         {
 58             for(j=i;j<=n&&height[j]>=mid;j++)
 59             {
 60                 if(sa[j-1]<len&&sa[j]>len||sa[j-1]>len&&sa[j]<len)
 61                     return true;
 62             }
 63             i=j-1;
 64         }
 65     }
 66     return false;
 67 }
 68 int main()
 69 {
 70     int n,len,low,high,mid,i,j,k;
 71     bool first=true;
 72     while(~scanf(" %s",s))
 73     {
 74         if(first)
 75             first=false;
 76         else
 77             putchar('\n');
 78         len=strlen(s);
 79         s[len]='#';
 80         scanf(" %s",s+len+1);
 81         n=strlen(s);
 82         SA(n+1,'z'+1);
 83         Height(n);
 84         for(low=0,high=n;low<high;)
 85         {
 86             mid=(low+high)>>1;
 87             if(OK(n,len,mid))
 88                 low=mid+1;
 89             else
 90                 high=mid;
 91         }
 92         low--;
 93         if(low)
 94         {
 95             for(i=1;i<=n;i++)
 96             {
 97                 if(height[i]>=low)
 98                 {
 99                     for(j=i;j<=n&&height[j]>=low;j++);
100                     for(k=i;k<j;k++)
101                     {
102                         if(sa[k-1]<len&&sa[k]>len||sa[k-1]>len&&sa[k]<len)
103                             break;
104                     }
105                     if(k!=j)
106                     {
107                         for(k=sa[i];k<sa[i]+low;k++)
108                             putchar(s[k]);
109                         putchar('\n');
110                     }
111                     i=j-1;
112                 }
113             }
114         }
115         else
116             puts("No common sequence.");
117     }
118     return 0;
119 }

转载于:https://www.cnblogs.com/DrunBee/archive/2012/07/11/2586005.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值