基因组复制距离的进展
在生物学研究中,基因组的结构和进化是重要的研究方向。本文将详细介绍基因组相关的基本概念、进化事件、基因组距离的计算,以及解决特定基因组问题的算法。
1. 基本概念
- 基因与字符串 :设 $\Sigma$ 是一个包含 $n$ 个基因的集合。字符串是来自 $\Sigma$ 的基因序列,每个基因根据其方向带有正负号。字符串 $X = x_1x_2 \cdots x_r$ 的反向是 $-X = -x_r -x_{r - 1} \cdots -x_1$。
- 染色体与基因组 :染色体是一个字符串,基因组是染色体的集合。单染色体基因组只有一个染色体,多染色体基因组至少有两个非空染色体 $C_1, C_2, \cdots, C_N$。染色体又分为环形染色体和线性染色体,环形染色体是一个字符串 $x_1 \cdots x_r$,其中 $x_1$ 被认为跟随在 $x_r$ 之后;线性染色体为了表示其端点,在每个末端添加一个“人工基因” $O$,即形式为 $Ox_1 \cdots x_rO$ 的字符串。在本文中,主要考虑环形单染色体基因组和线性多染色体基因组。
2. 进化事件与基因组距离
- 进化事件
- 反转(或倒位) :将染色体的某个子串替换为其反向的操作。
- 易位 :在两个染色体 $X = X_1X_2$ 和 $Y = Y_1Y_2$ 之间的操作,可将两
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



