在序列比对时,因为空格插入不同产生了多种序列排序方案,可以通过替换计分矩阵这一计分规则来筛选出比对最大相似度的方案。
核酸和蛋白质分别有不同的替换计分矩阵。
核酸
等价矩阵
相同核苷酸之间的匹配得分为1,不同核苷酸间的替换为0。
转换-颠换矩阵
核酸的碱基按照结构可分为两类:
-
嘌呤(两个环)
-
嘧啶(一个环)
不同结构之间替换称为颠换,相同结构替换为转换
在进化中转换频率远大于颠换,所以转换得分为-1,颠换为-5。
BLAST矩阵
经过大量实际比较得,核苷酸相同的+5,反之为-4,则效果较好,该矩阵被广泛采用。
蛋白质
等价矩阵
相同氨基酸之间的匹配得分为1,不同氨基酸间的替换为0。
遗传密码矩阵GCM
通过计算一个氨基酸残基转变到另一个氨基酸残基所需的密码子中碱基变化数目而得到的,矩阵元素的值对应于代价。
疏水矩阵
不同的氨基酸具有不同的疏水性,而疏水性对蛋白质的结构和功能有很大影响,所以根据氨基酸替换前后的疏水性变化,进行打分。
PAM矩阵
Dayhoff模型:可接受点突变
有些氨基酸替换较为频繁,自然界易接受这种突变,也就是可接受点突变,得分应该较高
PAM矩阵是目前蛋白质序列比较中最广泛使用的计分方法之一。
PAM矩阵中的元素表示是在一给定进化时期内氨基酸替换为某一氨基酸的变化概率,给定的进化时间就是一

序列比对使用替换计分矩阵如等价、转换-颠换、BLAST、PAM和BLOSUM来评估核酸和蛋白质的相似度。PAM适用于较近关系序列,BLOSUM适合远关系序列,BLOSUM-62常用于近关系比对,而PAM-250在远距离比对时可能精度不足。
最低0.47元/天 解锁文章
4097

被折叠的 条评论
为什么被折叠?



