双切连接(DCJ)排序与减半中的染色体重新整合问题
一、引言
在生物进化过程中,基因组会经历大规模的突变,例如DNA片段可能会发生反转或移动到其他位置。在基因组重排问题中,我们的目标是找到一系列操作,将一个基因组转换为另一个基因组,并且使操作序列的长度最短。这样的操作序列可以解释基因组之间的差异,其长度也可用于估计进化距离。
双切连接(DCJ)操作是一种用于模拟基因组重排的模型,它可以统一地模拟大多数大规模突变事件,如反转、易位、融合和分裂。此外,通过两次DCJ操作,还可以模拟转座或块交换,即先提取染色体的一个合适片段,形成一个临时的环状染色体,然后将其重新插入到正确的位置。
现有的线性时间算法在解决排序和减半问题时,忽略了临时环状染色体创建后立即重新整合的约束。对于受限的排序问题,之前只有二次算法;而受限的减半问题则被认为是一个开放问题。本文提出了新的算法,分别在$O(n log n)$时间内解决排序问题,在$O(n^{3/2})$时间内解决减半问题。
二、基础知识
(一)基因组模型
在DCJ模型中,基因组$\Pi$和$\Gamma$由相同的标记(基因、同线块)集合组成。每个标记$g$有两个端点,称为末端,分别表示为$g-$和$g+$。每个末端$p$要么与另一个末端$q$相邻(染色体上的两个连续标记),要么是端粒(线性染色体的末端)。前者形成邻接$pq$,后者形成端粒邻接$p◦$。因此,基因组是一组邻接的集合,使得每个末端恰好位于一个(可能是端粒的)邻接中。
对于基因组$\Pi$,可以绘制一个基因组图$G_{\Pi}$,其中顶点是末端,边连接相邻的末端或同一标记的两个末端。该图中的每个顶点的
超级会员免费看
订阅专栏 解锁全文
24

被折叠的 条评论
为什么被折叠?



