基因序列相似度(LCS)

本文介绍了一种基于对齐方法的基因序列相似度计算算法,通过插入空格使两个基因序列长度相等,并利用基因分值矩阵计算序列的匹配得分。文章详细解释了算法的具体实现过程,包括初始化步骤和动态规划求解最优对齐方案。

目录

1.问题描述

2.一些细节

3.思路

4.代码


1.问题描述

基因序列包含四种核苷酸,分别用A,C,T和G四个字母简单地表示。 编写一个程序,按以下规则比较两个基因并确定它们的相似程度。

规则:使用对齐方法,可以在基因的适当位置插进空格,让两个基因的长度相等,然后根据基因分值矩阵计算分数。

例如,给AGTGATG插入一个空格,就得到AGTGAT-G;给GTTAG插入三个空格,就得到-GT--TAG。空格用减号(-)表示。

把 AGTGAT-G与-GT--TAG 对齐以后,有四个基因是相配的:第二位的G,第三位的T,第六位的T和第八位的G。根据下列基因分值矩阵,每对匹配的字符都有相应的分值。 * 表示空格对空格是不允许的。上面对齐的字符串分值是: (-3)+5+5+(-2)+(-3)+5+(-3)+5=9。

A

C

G

T

-

A

5

-1

-2

-1

-3

C

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值