基因复制问题的快速纠错算法与蛋白质 - 蛋白质相互作用预测方法
基因复制问题的纠错算法
在基因树 - 物种树的调和过程中,基因树推断的误差是一个不可忽视的问题。为了解决这个问题,研究人员提出了一系列基于基因复制问题的快速有效纠错算法。
关键概念与理论
- 分数差的定义 :对于给定的树 (G) 和 (G’),分数差 (\Delta_{G,G’}) 定义为 (\Delta_{G,G’} := \sum_{e\in E(P_{G’})} \Delta_e),其中 (\Delta_e = \Delta(G’‘, S) - \Delta(G’, S))。这里的 (G’‘) 和 (G’) 是相关的树结构,(S) 是物种树。
- 定理 3 :对于给定的 (S)、(G) 和 (v \in V(G)),树 (G’ \in V(X)) 是 R - SEC 问题的输出,当且仅当 (\Delta_{G,G’} = \min_{G’‘\in V(X)} \Delta_{G,G’‘})。这个定理为判断 R - SEC 问题的解提供了理论依据。
算法实现
为了解决 R - SEC 问题,研究人员提出了 Algo - R - SEC 算法,其具体步骤如下:
1. 重新嫁接子树 :将子树 (G_v) 修剪并重新嫁接到 (Ro(G)) 上,得到树 (G)。
2. 计算 LCA 映射和复制分数 :计算 (G) 的最近共同祖先(LCA)映射和复制分数。
超级会员免费看
订阅专栏 解锁全文
1135

被折叠的 条评论
为什么被折叠?



