嘈杂基因组重排与二元近完美系统发育树的简单重建
嘈杂基因组重排
在基因组研究中,对基因组进行比较和分析是理解生物进化和遗传机制的重要手段。然而,实际数据中往往存在噪声,这给基因组重排的研究带来了挑战。
-
条带与最大权重团问题
- 预条带的定义 :一个单例不算预条带,但两个连续的单例算预条带。在构建条带时,我们只需考虑最大预条带的连续子序列。例如,对于最大预条带 a1 a3 A1 a6 a9,若有因素阻止 A1 与 a1 a3 和 a6 a9 形成条带,那么 a1 a3 和 a6 a9 也无法形成条带。由此得出命题 1:通过从两个基因组中删除基因形成的所有可能条带,是两条染色体(每个基因组一条)的不可扩展公共子序列(或其反向)的连续子序列,且至少包含两个基因。
- 兼容性矩阵与图的构建 :有了预条带集合后,需要构建预条带之间的兼容性矩阵。若两个预条带共享至少一个基因,或者其中一个包含破坏另一个基因连续性的基因,则它们不兼容。命题 2 表明,对于任意一组两两兼容的预条带 C,删除所有不在 C 中预条带的基因后得到的简化基因组中,C 中每个预条带的基因都表现为条带。从两个原始的 n 基因基因组中,我们希望找到一种完全由条带组成的简化方式,使删除的基因数量 d 最小。通过兼容性矩阵构建图 G,预条带为顶点,兼容的顶点由边连接。命题 3 指出,图 G 上最大权重团问题的解 C(预条带 i 的权重 w(i) 为其包含的基因数量)能诱导原始基因组的简化,使其完全由条带组成,且删除的基因数量最小,证明基于命题 1 和 2
超级会员免费看
订阅专栏 解锁全文
8093

被折叠的 条评论
为什么被折叠?



