基因组进化模拟与分析:从模型到工具
1. 新型基因组进化模型
1.1 模型操作概述
新型基因组进化模型涵盖重排、复制和丢失操作。模型操作不一定对应实际进化事件,但运行模型能产生更接近实际基因组的模拟基因组。
- 基因复制 :均匀选择起始位置复制染色体短片段,并将新副本放置在基因组新位置。设定 $L_{max}$ 为复制片段的最大基因数,片段基因数是 1 到 $L_{max}$ 间的均匀随机数。例如,选择片段 $a_{i+1} \cdots a_{i+L}$ 复制并插入邻接对 ${b_{h}^{j}, b_{t}^{j+1}}$ 之间,此操作复制 $L$ 个基因和 $L - 1$ 个邻接对,移除一个邻接对,添加两个新邻接对。
- 基因丢失 :从候选基因集中均匀选择一个基因删除,每次仅删除一个基因副本。例如,删除染色体 $(\cdots a_{i - 1}a_{i}a_{i + 1}\cdots)$ 中的基因 $a_{i}$,从基因多重集中移除一个 $a_{i}$ 副本,两个邻接对 ${a_{h}^{i - 1}, a_{t}^{i}}$ 和 ${a_{h}^{i}, a_{t}^{i + 1}}$ 被一个邻接对 ${a_{h}^{i - 1}, a_{t}^{i + 1}}$ 替代。
1.2 模型重排结果
1.2.1 编辑距离计算
两个基因组的编辑距离是将一个基因组转化为另一个所需的最少允许进化操作数。
- 对于基因含量相同且无重复基因的线性染色体基因组,Hannenhalli 和 Pevzner 模型可计算反转、易位、融合和
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



