目录
1.问题描述
基因序列包含四种核苷酸,分别用A,C,T和G四个字母简单地表示。 编写一个程序,按以下规则比较两个基因并确定它们的相似程度。
规则:使用对齐方法,可以在基因的适当位置插进空格,让两个基因的长度相等,然后根据基因分值矩阵计算分数。
例如,给AGTGATG插入一个空格,就得到AGTGAT-G;给GTTAG插入三个空格,就得到-GT--TAG。空格用减号(-)表示。
把 AGTGAT-G与-GT--TAG 对齐以后,有四个基因是相配的:第二位的G,第三位的T,第六位的T和第八位的G。根据下列基因分值矩阵,每对匹配的字符都有相应的分值。 * 表示空格对空格是不允许的。上面对齐的字符串分值是: (-3)+5+5+(-2)+(-3)+5+(-3)+5=9。
| A |
C |
G |
T |
- |
|
| A |
5 |
-1 |
-2 |
-1 |
-3 |
| C |

本文介绍了一种基于对齐方法的基因序列相似度计算算法,通过插入空格使两个基因序列长度相等,并利用基因分值矩阵计算序列的匹配得分。文章详细解释了算法的具体实现过程,包括初始化步骤和动态规划求解最优对齐方案。
最低0.47元/天 解锁文章
484

被折叠的 条评论
为什么被折叠?



