高效简约和解算法在 D、T、L 事件中的应用
在生物信息学领域,基因树和物种树的和解是一个重要的研究方向。本文将介绍一种新的简约和解算法,该算法考虑了基因的复制(D)、转移(T)和丢失(L)事件,并通过模拟实验对其性能进行了评估。
实验设置
为了评估简约准则的性能,我们使用了一个大规模的模拟数据集。具体步骤如下:
1. 生成模拟数据
- 模拟物种树 :使用标准的出生 - 死亡过程生成了 10 个包含 100 个物种的随机超度量物种树,所有物种树的高度被归一化到一个共同的高度 h。
- 模拟 DTL 场景 :从物种树的根节点(时间 t = h)开始,以单个基因为起点,根据泊松过程生成进化场景,该过程由复制、转移和丢失的速率来表征。在每个时间点 t,每个现存基因以速率 rδ 进行复制,以速率 rλ 发生丢失,以速率 rτ 向物种树的每个分支进行转移。
- 生成数据集 :我们选择了两种不同的方式来变化复制、转移和丢失的速率,生成了两个数据集 ds1 和 ds2。
- ds1 :固定丢失速率 rλ = 0.7(树高 h = 1),在区间 [0.01, 0.35] 内变化 rδ 和 rτ 的值,每个参数选择 11 个值,共生成 11 × 11 组速率。对于每个物种树和每组参数,生成 5 个基因树,总计 6,050 个基因树。
- ds2 :固定 rλ / (rδ + rτ + rλ) = 0.7,使用 4 种不同的树高 h =
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



