基因树与药物基因组学模型研究
基因树重建相关研究
NNIST 问题概述
NNIST 问题旨在给定一组无根基因树 G 的情况下,找到能使总成本 $\sum_{G\in G} \sigma_{\alpha,\beta}(S, G)$ 最小的物种树 S。不过,该问题的复杂度目前尚不明确。鉴于类似的复制模型问题属于 NP 难题,因此研究人员开发了启发式算法来解决 NNIST 问题。
在实际应用中,通常无需对基因树的所有 NNI 变体进行搜索。例如,弱边就是 NNI 操作的理想候选对象。弱边一般依据其长度来定义,短边通常被视为弱边。具体而言,假设基因树 G 中的每条边都有长度,若边 e 的长度小于非负实数 ω,则称边 e 为弱边。基于此,我们可以分别定义 ω - NNIC 和 ω - NNIST 这两种 NNI - C 和 NNI - ST 的变体,其中 NNI 操作仅在弱边上进行。
实验过程
- 数据准备
- 从 Genolevures 3 数据集中的九个酵母基因组中推断出 4133 个带分支长度的无根基因树。这些酵母物种包括:C. glabrata(4957 个蛋白质序列,缩写 CAGL)、S. cerevisiae(5396 个,SACE)、Z. rouxii(4840 个,ZYRO)、S. kluyveri(5074 个,SAKL)、K. thermotolerans(4933 个,KLTH)、K. lactis(4851 个,KLLA)、Y. lipolytica(4781 个,YALI)、D. hansenii(5006 个,DEHA)和 E. gossy
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



