基因组距离计算与参数估计算法的研究与应用
1. DCJ 距离的线性时间近似算法
1.1 一致分解算法
在处理基因组的 DCJ 距离问题时,提出了 Consistent - Decomposition 算法,该算法接收两个线性单染色体平衡基因组 A 和 B(其中每个基因出现次数上限为 k),返回一个关于这两个基因组的一致分解,此分解是 DCJ 距离的 O(k) 近似。其主要步骤如下:
1. 获取加帽基因组 :给 A 和 B 添加空末端/邻接,分别得到 Aτ 和 Bτ。
2. 构建邻接图 :构建 Aτ 和 Bτ 的邻接图 AG(Aτ, Bτ)。
3. 近似长度为 2 的循环集 :使用最小公共字符串划分问题的 O(k) 近似算法,获取 AG(Aτ, Bτ) 中长度为 2 的循环集 S2 的 O(k) 近似。
4. 移除相关顶点和边 :从邻接图中移除 S2 覆盖的顶点以及与 S2 中边不兼容的所有边。
5. 分解剩余图 :通过迭代找到一致循环 C,然后从图中移除 C 覆盖的顶点和与 C 中边不兼容的边,将这些循环收集到 S> 中。
6. 移除空末端/邻接 :移除 S2 ∪ S> 中循环的空末端/邻接,得到 AG(A, B) 的一致分解 D。
7. 返回结果 :返回 D。
以下是算法的伪代码:
超级会员免费看
订阅专栏 解锁全文
1795

被折叠的 条评论
为什么被折叠?



