14、GESTALT:基因组斯坦纳比对算法解析

GESTALT:基因组斯坦纳比对算法解析

在生物信息学领域,多序列比对是一项至关重要的任务,它对于理解生物序列的进化关系、功能预测等方面具有重要意义。GESTALT(GEnomic sequences STeiner ALignmenT)就是一款用于解决多序列比对问题的程序套件,下面将详细介绍它的原理、流程和计算结果。

1. 基本原理与GESTALT概述

在多序列比对中,存在两种常见的目标:树比对(TA)和和对(SP)比对。对于任意一组序列构成的树,存在一种多序列比对,使得树中由边相连的序列对的比对距离是最优的。Feng和Doolittle的方法可以将树比对问题的解(即给定树的内部节点的标记)转化为叶子节点的多序列比对。并且,对于非树边端点的序列对,其在比对中的距离可以通过三角不等式进行上界估计。

GESTALT是一个程序套件,可用于TA和SP多序列比对。它的主要输入是一组n个序列L = {S1, …, Sn},以及可能的系统发育树T。如果没有提供系统发育树,算法会内部计算一个,用于寻找具有小SP值的比对;如果提供了树,则优化TA目标。输出包括输入序列的多序列比对,以及一些额外信息,如系统发育树内部节点计算得到的斯坦纳序列。

GESTALT基于Ravi和Kececioglu的思想,使用叶子节点的斯坦纳序列来标记树的内部节点。虽然Ravi和Kececioglu证明了在d - 元树的情况下,该方法对TA有(d + 1) / (d - 1)的近似比,但GESTALT不限制节点的度为常数,不过仍然对TA目标有2的性能保证,对于SP比对输出也有2 - 近似保证。

2. 多序列比对启发式程序流程

多序列比对启发式程序主要包括以下

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值