DNA比对－－蓝桥杯国赛j历年真题

最新推荐文章于 2024-03-18 23:55:26 发布

原创最新推荐文章于 2024-03-18 23:55:26 发布 · 329 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #蓝桥杯 #递归

蓝桥杯java历年真题专栏收录该内容

11 篇文章

订阅专栏

本文介绍了一种用于计算两个DNA序列之间编辑距离的算法。该算法通过递归方式实现，考虑了漏掉、错码及重码三种变异情况。适用于生物信息学中评估序列相似度。

【编程题】(满分27分)

脱氧核糖核酸即常说的DNA，是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为：A、G、C、T。

DNA携带的遗传信息可以用形如：AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差，这才最终造就了生物的多样性。

为了简化问题，我们假设，DNA在复制的时候可能出现的偏差是（理论上，对每个碱基被复制时，都可能出现偏差）：

　　1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为：AGT

2. 错码，例如把 AGGT 复制成了：AGCT

3. 重码，例如把 AGGT 复制成了：AAGGT

如果某DNA串a，最少要经过 n 次出错，才能变为DNA串b，则称这两个DNA串的距离为 n。

例如：AGGTCATATTCC 与 CGGTCATATTC 的距离为 2

你的任务是：编写程序，找到两个DNA串的距离。

【输入、输出格式要求】

用户先输入整数n(n<100)，表示接下来有2n行数据。

接下来输入的2n行每2行表示一组要比对的DNA。（每行数据长度<10000）

程序则输出n行，表示这n组DNA的距离。

例如：用户输入：
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT

则程序应输出：
1
1
2

【注意】

请仔细调试！您的程序只有能运行出正确结果的时候才有机会得分！

在评卷时使用的输入数据与试卷中给出的实例数据可能是不同的。

请把所有函数写在同一个文件中，调试好后，拷贝到【考生文件夹】下对应题号的“解答.txt”中即可。

相关的工程文件不要拷入。

源代码中不能使用诸如绘图、Win32API、中断调用、硬件操作或与操作系统相关的API。

允许使用STL类库，但不能使用MFC或ATL等非ANSI c++标准的类库。

例如，不能使用CString类型（属于MFC类库），不能使用randomize, random函数（不属于ANSI C++标准）

代码（递归解决）：

package 历届国赛;
import java.io.*;
public class DNA比对 {
static int dfs(String s1,String s2){
	if(s1.length()==1 ){
		if(!s1.equals(s2.substring(0, 1))){
			return s2.length();
		}else return s2.length()-1;
	}
	else if(s2.length() == 1){
		if(!s2.equals(s1.substring(0, 1))){
			return s1.length();
		}else return s1.length()-1;
	}else{
		if(s1.substring(0, 1).equals(s2.substring(0, 1))){
			return dfs(s1.substring(1),s2.substring(1));
		}else return Math.min(dfs(s1.substring(1),s2)+1, dfs(s1,s2.substring(1))+1);
	}
}
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String s1 = "AGCTAAGGCCTT";
		String s2 = "AGCTTAAGGCTT";
		System.out.print(dfs(s1,s2));
	}

}