GESTALT:基因组斯坦纳比对算法解析
在生物信息学领域,多序列比对是一项至关重要的任务,它对于理解生物序列的进化关系、功能预测等方面具有重要意义。GESTALT(GEnomic sequences STeiner ALignmenT)就是一款用于解决多序列比对问题的程序套件,下面将详细介绍它的原理、流程和计算结果。
1. 基本原理与GESTALT概述
在多序列比对中,存在两种常见的目标:树比对(TA)和和对(SP)比对。对于任意一组序列构成的树,存在一种多序列比对,使得树中由边相连的序列对的比对距离是最优的。Feng和Doolittle的方法可以将树比对问题的解(即给定树的内部节点的标记)转化为叶子节点的多序列比对。并且,对于非树边端点的序列对,其在比对中的距离可以通过三角不等式进行上界估计。
GESTALT是一个程序套件,可用于TA和SP多序列比对。它的主要输入是一组n个序列L = {S1, …, Sn},以及可能的系统发育树T。如果没有提供系统发育树,算法会内部计算一个,用于寻找具有小SP值的比对;如果提供了树,则优化TA目标。输出包括输入序列的多序列比对,以及一些额外信息,如系统发育树内部节点计算得到的斯坦纳序列。
GESTALT基于Ravi和Kececioglu的思想,使用叶子节点的斯坦纳序列来标记树的内部节点。虽然Ravi和Kececioglu证明了在d - 元树的情况下,该方法对TA有(d + 1) / (d - 1)的近似比,但GESTALT不限制节点的度为常数,不过仍然对TA目标有2的性能保证,对于SP比对输出也有2 - 近似保证。
2. 多序列比对启发式程序流程
多序列比对启发式程序主要包括以下
超级会员免费看
订阅专栏 解锁全文
1228

被折叠的 条评论
为什么被折叠?



