基于集合覆盖的氨基酸替换矩阵确定方法及多序列比对启发式算法解析
1. 引言
在计算分子生物学中,序列比对是核心问题之一,尤其在蛋白质序列比对方面,由于氨基酸残基集合较大且氨基酸间结构和功能交换标准多样,使得选择合适的评分参数(替换矩阵和间隙成本函数)变得极具挑战性。本文将介绍一种基于集合覆盖的氨基酸替换矩阵确定方法,以及一种多序列比对的启发式算法,并展示相关的计算结果。
2. 氨基酸替换矩阵确定方法
- 基本原理 :该方法基于已有的氨基酸残基集合覆盖和描述残基可交换性的无向图。对于给定的从集合覆盖获取边权重,再从图上的加权距离得到替换矩阵元素的函数形式,所得到的替换矩阵可以根据已知的参考比对集和给定的间隙成本进行性能检验。寻找合适的函数形式和间隙成本可以被表述为一个优化问题,目标是最大化替换矩阵在参考比对集上的性能。
- 具体步骤 :
- 考虑一个氨基酸集合覆盖。
- 从集合覆盖构建一个图。
- 建立一个优化问题,其解即为所需的替换矩阵和间隙成本。
- 优化问题 :该优化问题定义在一组目标序列对上,这些目标对假定有已知的比对。问题的最优解包括替换矩阵和间隙成本,使用预定义的比对算法时,它们能使目标对的比对在某种意义上最接近已知的比对。由于这是一个组合搜索问题,缺乏可微性,因此采用启发式方法求解。
超级会员免费看
订阅专栏 解锁全文
71

被折叠的 条评论
为什么被折叠?



