POJ 3691 and Hduoj 2457 DNA repair

本文介绍了一种结合AC自动机与动态规划解决DNA修复问题的方法。通过构建AC自动机追踪字符串匹配状态,并利用动态规划求解最小编辑距离,确保不包含致病基因序列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

POJ 3691 DNA repair

Hduoj 2457 DNA repair

        AC自动机+DP。先建立AC自动机,再来看DP。和前面类似考虑方程的时候我们可以结合字符串的长度与AC自动机的状态,来写方程。设dp[i][j]是单词长度为i走到j时最少需要修改单词的个数。那么考虑状态的转化,由于要不含致病基因,那么也就是状态不能走到叶节点。考虑状态j是由那些转化而来的?这些状态转化只决定于AC自动机,我们在构建AC自动机的时候利用虚节点来确定每一个状态当遇到某个字符时状态的转化结果。考虑kj的前一个状态,如果修改第i个字符可以由k走到j,那么有dp[i][j] = dp[i-1][k] + 1,如果不用修改第i个字符可以由k走到j,那么有dp[i][j] = dp[i-1][k] ,由于是要求最小的,所以我们只需要取这些之中的最小即可。

/*
Author    :csuchenan
LANG      :c++
Algorithm : DP + AC
*/
#include <cstdio>
#include <cstring>
#include <queue>
using namespace std ;
#define INF 0x3c3c3c3c
#define maxn 1010

int  next[maxn][4] ;
int  fail[maxn] ;
bool flag[maxn] ;
int  dp[1001][maxn] ;
char target[1001] ;
int cnt ;
int N ;

void init(){
	memset(next , 0 , sizeof(next)) ;
	memset(flag , 0 , sizeof(flag)) ;
	memset(fail , 0 , sizeof(fail)) ;
	memset(dp  , 0x3c , sizeof(dp)) ;
	cnt = 0 ;
}

int hash(char c){
	switch(c){
		case 'A' : return 0 ;
		case 'C' : return 1 ;
		case 'G' : return 2 ;
		case 'T' : return 3 ;
	}
}

void insert(char * str){
	char *p = str ;
	int b ;
	int c(0) ;

	while(*p){
		b = hash(*p) ;
		if(!next[c][b])
			next[c][b] = ++ cnt ;
		c = next[c][b] ;
		p ++ ;
	}
	flag[c] = 1 ;
}

bool read(){
	scanf("%d" , &N) ;
	if(!N)
		return 0 ;

	init() ;
	char str[25] ;

	for(int k = 1 ; k <= N ; k ++){
		scanf("%s" , str) ;
		insert(str) ;
	}
	scanf("%s" , target + 1) ;
	return 1 ;
}

void build_ac(){
	queue<int> Q ;
	int cur(0)  ;
	int child   ;
	int tmp , k ;

	fail[cur] = 0 ;
	Q.push(cur) ;

	while(!Q.empty()){
		cur = Q.front() ;
		Q.pop() ;

		for(k = 0 ; k < 4 ; k ++){
			child = next[cur][k] ;
			if(child){
				Q.push(child) ;
				if(!cur)
					fail[child] = 0 ;
				else{
					tmp = fail[cur] ;
					for( ; tmp && !next[tmp][k] ; tmp = fail[tmp])
						;
					if(next[tmp][k])
						fail[child] = next[tmp][k] ;
					else
						fail[child] = 0 ;
				}
				if(flag[ fail[child] ])
					flag[child] = 1 ;
			}
			else{
				next[cur][k] = next[ fail[cur] ][k] ;
			}
		}
	}
}

inline int min(int a , int b){
	return a < b ? a : b ;
}

void solve(){

	build_ac() ;
	int k ;
	int i ;
	int j ;

	dp[0][0] = 0 ;
	int len = strlen(target + 1) ;
	for(int i = 1 ; i <= len ; i ++){
		for(int j = 0 ; j <= cnt ; j ++){
			if(flag[j])
				continue ;
			for(int k = 0 ; k < 4 ; k ++){
				int cur = next[j][k] ;

				if(flag[cur])
					continue ;

				if(k == hash(target[i]) )
					dp[i][cur] = min(dp[i][cur] , dp[i-1][j]) ;
				else
					dp[i][cur] = min(dp[i][cur] , dp[i-1][j] + 1) ;
			}
		}
	}
	int ans = INF ;
	for(i = 0 ; i <= cnt ; i ++){
		if(flag[i])
			continue ;
		ans = min(ans , dp[len][i]) ;
	}
	printf("%d\n" , ans==INF ? -1 : ans) ;
}

int main(){
    int t(0) ;
	while(read()){
		printf("Case %d: ", ++t) ;
		solve() ;
	}
	return 0 ;
}




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值